PDF.chat API

Upload PDF u chat miegħu mill-app tiegħek stess — jistaqsu mistoqsijiet u jiksbu tweġibiet ikkwotati għall-paġna, f'100 + lingwi.Mkejla għal kull paġna, l-ebda sorpriżi.

Ħarsa ġenerali

Il-PDF.chat API huwa interface REST żgħar. L-ewwel inti POST dokument biex jibilgħu dan u jiksbu lura xogħol mat-test tad-dokument u t-tqassim għal kull paġna (test, kaxxi bounding, kunfidenza). POST Xogħlijiet ta’ 5 paġni jew inqas jiġu rritornati inline; xogħlijiet akbar jiġu rritornati immedjatament b’link għall-paġna ta’ għajnuna, u xogħlijiet ta’ 10 paġni jew inqas jiġu rritornati inline; xogħlijiet akbar jiġu rritornati immedjatament b’link għall-paġna ta’ għajnuna, u pending status li inti poll sakemm done.

  • URL bażiku: https://pdf.chat
  • Dokumenti f': PDF, kif ukoll Word, PowerPoint, test, u immaġnijiet (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat minn: tweġibiet b’ċitazzjonijiet ta’ paġni; tranżazzjonijiet permezz tal-punt aħħari tal-istorja
  • Test ipproċessat barra: txt, md, docx, pdf, csv, json
  • Magni tal-qari: cpu (dokumenti stampati malajr) u vlm (premium AI, kitba bl-idejn, tqassim kumpless, matematika)

Awtentikazzjoni

Awtentika bil-password tiegħek Token tal-API (ssibha fuq il- paġna tal-kont) bħala Header tal-Bejjiegħ:

Authorization: Bearer YOUR_API_TOKEN

Tista' wkoll tgħaddi ?api_token=… L-użu jitkejjel kontra l-bilanċ tal-paġna tal-kont tiegħek.

Ippreżenta dokument

POST /api/v1/ocr/, upload tal-formola b’diversi partijiet.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Jirritorna x-xogħol. Għal fajls ≤5-paġna huwa diġà done bit-test; fajls akbar jiġu lura pending/processing, poll l-endpoint status.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Ikseb riżultat

GET /api/v1/ocr/<uuid>/, poll sakemm status huwa done jew failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Niżżel format

GET /api/v1/ocr/<uuid>/download/?format=md, jesportaw ir-riżultat. format huwa wieħed minn txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat b’dokument

Staqsi mistoqsijiet dwar xogħol lest. It-tweġibiet huma bbażati biss fit-test estratt u jikkwotaw il-paġna sors. Jeħtieġ token kont, il-karatteristika chat huwa kont-gated.

POST /api/v1/chat/<uuid>/, Korp JSON {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Jirritorna l-messaġġ assistent bit-tweġiba tiegħu u lista ta' paġni ċċitati:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, iġib it-tranżmissjoni sħiħa tal-konversazzjoni għal xogħol.

Eżempji ta’ kodiċi

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Parametri

QasamTipDeskrizzjoni
filefileMeħtieġ. L-immaġni jew PDF biex tipproċessa.
tierstringcpu (default, veloċi/stampat) jew vlm (premium AI: kitba bl-idejn, tqassim, matematika).
languagestringauto (default) jew kodiċi tal-lingwa (en, ch, ja, ar, …).
toolstringGħodda fakultattiva tal-bużżieqa (eż. summarize-pdf, ask-pdf) biex pre-frame l-chat għal dak il-kompitu.

Żbalji & limiti

KodiċiTfisser
400Ebda fajl, tip mhux appoġġjati, jew fajl kbir wisq.
401Token tal-API nieqes jew invalidu.
402Mingħajr paġni, il-limitu ta' kuljum/xahar b'xejn laħaq, jew l-ebda krediti. Il-korp jinkludi used/cap.
404Job UUID ma nstabx.
409Download mitlub qabel ix-xogħol lest.

Kull paġna pproċessati spejjeż krediti (1/paġna fuq il-livell veloċi, aktar fuq premium). pjanijiet imħallsa jgħollu għal kull fajl paġna kapijiet u żid prijorità. prezzijiet.

Mistoqsijiet li jsiru ta' spiss

Oħloq kont b'xejn u tiftaħ tiegħek paġna tal-kont, it-token tiegħek jidher hemm b'buttuna tal-kopja.

Iva, fajls ta' 5 paġni jew inqas jirritornaw ir-riżultat sħiħ fil-linja fir-rispons POST, għalhekk l-ebda polling huwa meħtieġ għall-biċċa l-kbira immaġini u PDFs qosra.

Aktar minn 100, inklużi l-kitbiet Latini, CJK, Għarab, Ċirilliku u Indjani. Użu language=auto biex jiskopru, jew jgħaddu kodiċi speċifiku.

It-tniżżil huwa pproċessat biss biex iwieġeb il-mistoqsijiet tiegħek u jitneħħa awtomatikament.Qatt ma nbigħu, naqsmu jew inħarrġu fuq id-dokumenti tiegħek.

L-użu huwa mkejjel għal kull paġna kontra l-bilanċ tal-kont tiegħek: sejħiet anonimi jiksbu allowance kuljum għal kull IP, kontijiet ħielsa barmil kull xahar, u l-pjanijiet imħallsa jużaw krediti mixtrija b'għoli għal kull paġna tal-fajl kapijiet u prijorità.Meta inti run out inti tikseb 402 ma użati u l-kap fil-korp.

Tista' tibgħat PNG, JPG, WEBP, GIF, BMP, TIFF, u PDF b'ħafna paġni.Riżultati tniżżel bħala txt, md, docx, pdf (tfittxija), csv, jew json permezz tal-parametru tal-format tal-punt aħħari tat-tniżżil.

400 huwa fajl nieqes, tip mhux appoġġjat, jew fajl kbir wisq; 401 token nieqes jew invalidu; 402 barra mill-paġni; 404 UUID tax-xogħol mhux magħruf; u 409 download mitlub qabel ix-xogħol jintemm.

A oġġett tax-xogħol mal-istatus, tier, lingwa, page_count, u mean_confidence, flimkien mat-test sħiħ u markdown.Il-paġni array breaks kull paġna fi blokki bit-test tagħhom, bounding kaxxa (bbox), u kunfidenza għal kull blokk.

Uża cpu (l-awtomatiku) għal malajr, bi prezz baxx għar-rikonoxximent ta' dokumenti stampati nadif.Uża vlm, il-magna AI premium, għall-kitba bl-idejn, kumplessi jew multi-kolonna layouts, matematika, u traduzzjoni, fejn huwa ferm aktar preċiż.

Pass għodda b'slug (per eżempju sommarju-pdf jew ask-pdf) biex pre-frame l-chat għal dak il-kompitu, sabiex l-assistent huwa sintonizzat biex tiġbor fil-qosor jew twieġeb mistoqsijiet dwar id-dokument.

Fajls ta’ 5 paġni jew inqas jiġu lura fil-linja fit-tweġiba POST. Fajls akbar jiġu lura immedjatament bħala pendenti jew proċessar, u inti poll GET /api/v1/ocr/<uuid>/ sakemm l-istatus isir jew ifalli. Pjanijiet imħallsa jgħollu l-kap tal-paġna għal kull fajl.

L-API hija REST sempliċi fuq HTTPS, u għalhekk taħdem minn kwalunkwe lingwa b'klijent HTTP, ara l-eżempji Python, Node.js, u cURL hawn fuq.M'hemm l-ebda SDK biex tinstalla; ftit linji ta' kodiċi HTTP standard huma kollha li għandek bżonn.