PDF.chat API

د PDF او chat سره د خپل اپلیکیشن څخه یو PDF او chat ډاونلوډ کړئ - پوښتنې وکړئ او ځوابونه ترلاسه کړئ چې په 100 + ژبو کې د پاڼې ته اشاره کوي. په هر مخ کې اندازه کیږي، هیڅ حیرانتیا.

لټول

د PDF.chat API یو کوچني REST انٹرفیس دی. لومړی تاسو POST یو سند چې دا ingest او د سند د متن او د هر-پاڼه د ماتولو (د متن، د bounding بکسونو، اعتماد) سره د کار بیرته ترلاسه کړي. بیا تاسو POST د 5 مخونو یا لږ تر لږه د راستنېدو inline د کارونو؛ لوی کارونه په سمدستي سره د یو سره بېرته pending انکړ چې تاسو poll تر done.

  • : بنسټ URL https://pdf.chat
  • لاسوندونه په: PDF، سربیره پردې کلمه، پاور پوینټ، متن، او انځورونه (PNG، JPG، WEBP، GIF، BMP، TIFF)
  • Chat out: د مخ د نقلونو سره ځوابونه؛ د تاریخ د پای ټکي له لارې transcripts
  • :د ليکنې بهير ووت txt, md, docx, pdf, csv, json
  • : لوستونکی انجنونه cpu (ګړندی، چاپ شوي اسناد) او vlm (پریمیوم AI، لاسلیک، پیچلي ترتیب، ریاضیات)

کرونه

سره کرونه توکي API (په خپل دا ومومئ ګڼون مخ) لکه د Bearer سرليک:

Authorization: Bearer YOUR_API_TOKEN

تاسو هم کولای شئ چې تېر شي ?api_token=… د يوې پوښتنې د پارامتر په توګه. کارول د خپل حساب د مخ د توازن په وړاندې اندازه.

لاسوند لېږل

POST /api/v1/ocr/, multipart فورمه پورته.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

د کار بېرته. د ≤5-پاڼه دوتنې دا دی دمخه done سره د ليکنې؛ لويې دوتنې بېرته راځي pending/processing, د انکړ پای ټکی پوښتل.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

يوه پایله ترلاسه کول

GET /api/v1/ocr/<uuid>/, پوښتل تر status دی done يا failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

بڼه رالېښل

GET /api/v1/ocr/<uuid>/download/?format=md, د پایلې صادرات. format يو دی txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat سره د يو سند

د بشپړ شوي کار په اړه پوښتنې وپوښتئ. ځوابونه یوازې په استخراج شوي متن کې ځمکه کیږي او د سرچینې پاڼه یادوي. د حساب توکو ته اړتیا لري، د chat ځانګړتیا د حساب-ګیټ ده.

POST /api/v1/chat/<uuid>/, جېسن بدن {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

د مرستيال استوزه د هغې د ځواب او د يادو پاڼو د لړ سره راګرځوي:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, د يوې دندې لپاره د بشپړې خبرې اترې نقل را واخستل.

د کوډ بېلګه

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

پېرامې

ډګرډولسپړاوی
filefileاړين .د بهيرولو لپاره انځور يا PDF
tierstringcpu (تلواله، چټک/چاپ شوی) يا vlm (پریمیوم AI: لاسلیک، ترتیب، ریاضیات).
languagestringauto (تلواله) يا د ژبې کوډ (en, ch, ja, ar.
toolstringاختیاري وسیله slug (د بیلګې په توګه summarize-pdf, ask-pdf) د دې لپاره چې د دې دندې لپاره د chat دمخه چوکاټ.

تېروتنې او حدونه

کوډمانا
400.دوتنه نه شته، نه منل شوی ډول، يا دوتنه ډېره لويه ده
401.لټول شوی يا ناسم API توکي
402د مخونو څخه بهر، ورځني / میاشتني وړیا حد ته ورسید، یا هیڅ کریډیټونه. د بدن شامل دي used/cap.
404. دنده UUID ونه موندل شوه
409د دندې د پای نه مخکې رالېښنه غوښتل شوې ده.

هرې پاڼې پروسس شوي لګښتونه (د چټک ټیر په اړه 1 / پا pageه، د پریمیم په اړه نور). د تادیې پلانونه د هر فایل پا pageې کیپونه پورته کوي او لومړیتوب اضافه کوي. وګورئ پېر.

ډېرې پوښتنې

یو وړیا حساب جوړ کړئ او خپل خلاص کړئ ګڼون مخ. ستاسو توکي د نقل تڼۍ سره هلته ښودل کیږي.

هو، د 5 صفحو یا لږ فایلونه د POST ځواب کې د بشپړ پایلې انلاین بیرته راستون کړئ، نو د ډیری عکسونو او لنډ PDFs لپاره هیڅ پوښتل نه دي.

د 100 څخه زيات، په شمول د لاتین، CJK، عربي، سيريل او هندي ليکنو. کار language=auto د کشف، یا د ځانګړي کوډ تېر شي.

د پورته کولو پروسس یوازې ستاسو پوښتنو ته ځواب ورکولو لپاره پروسس کیږي او په اتوماتيک ډول ړنګیږي. موږ هیڅکله نه پلوري، شریک کړئ، یا ستاسو په اسنادو کې روزنه.

د کارولو په اړه د هرې صفحې په مقابل کې د حساب کیږي: نامعلومه زنګونه د هر IP ورځني معاش ترلاسه کوي، وړیا حسابونه د میاشتني بستر، او د تادیې پلانونه د لوړو پراساس فایلونو سره د کریډیټونو سره د پیرود شوي کریډیټونو سره کاروي. کله چې تاسو بهر ځي تاسو د 402 سره ترلاسه کوئ چې په بدن کې کارول کیږي او کیپ.

تاسو کولی شئ PNG، JPG، WEBP، GIF، BMP، TIFF، او څو مخ PDF واستوئ. پایلې د txt، md، docx، pdf (searchable)، csv، یا json په توګه ډاونلوډ کړئ د ډاونلوډ پای ټکي د فارمټ پارامتر له لارې.

400 یو ورک شوی فایل، غیر ملاتړ شوي ډول، یا د فایل ډیر لوی دی؛ 401 یو ورک یا نامناسب توکي؛ 402 د مخونو څخه بهر؛ 404 یو ناپېژندل شوی کار UUID؛ او 409 د ډاونلوډ غوښتنه د کار د پای ته رسیدو دمخه. د غلطۍ بدنونه یو لنډ پیغام شامل دي.

د يو کار څيز سره د حالت، طبقه، ژبه، page_count، او mean_confidence، سربېره پر دې د بشپړ متن او markdown. د مخونو د آري په خپل متن، bounding بکس (bbox)، او د هر-بلاک د باور سره په بلاکونو هر مخ ړنګوي.

د پاک چاپ شوي اسنادو د چټک، ټیټ لګښت پیژندلو لپاره د سی پی یو (د تل لپاره) وکاروئ. د VLM، د پریمیم AI انجن، د لاسلیک، پیچلي یا څو ستون ډیزاین، ریاضیاتو، او ژباړې لپاره وکاروئ، چیرې چې دا ډیر دقیق دی.

د یو سلګ سره وسیله (د بیلګې په توګه خلاصه-pdf یا پوښتنه-pdf) د دې لپاره چې د دې دندې لپاره د chat لپاره دمخه چوکاټ ته وسپارئ، نو د مرستیال د سند په اړه د پوښتنو لنډیز یا ځواب کولو لپاره تنظیم شوی.

د 5 مخونو یا لږترلږه د POST ځواب کې د 5 مخونو فایلونه. لوی فایلونه بیرته راځي لکه څنګه چې انتظار یا پروسس، او تاسو د GET /api/v1/ocr / پوښتل<uuid>/ تر هغه چې وضعیت ترسره شي یا ناکام شي. د تادیې پلانونه د هر فایل مخ کیپ پورته کوي.

API د HTTPS په اړه ساده REST دی، نو دا د HTTP پیرودونکي سره د هرې ژبې څخه کار کوي، د Python، Node.js، او cURL مثالونه پورته وګورئ. د نصب کولو لپاره هیڅ SDK شتون نلري؛ د معیاري HTTP کوډ ځینې کرښې تاسو ته اړتیا لرئ.