PDF.chat API

Nahrajte PDF a chat s ním z vlastnej aplikácie - klásť otázky a získať odpovede citované na stránke, vo viac ako 100 jazykoch.Meradlo na stranu, žiadne prekvapenia.

Prehľad

API PDF.chat je malé REST rozhranie. Najprv musíte POST Dokument, aby ste ho mohli prečítať a získať späť úlohu s textom dokumentu a rozdelením na strany (text, ohraničujúce rámčeky, dôveryhodnosť). POST Úlohy s 5 stranami alebo menej sa vrátia vložené; väčšie úlohy sa vrátia okamžite s odpoveďou na otázku, ktorá sa zobrazí v dokumente. pending Stav, ktorý si hlasovať, kým done.

  • Základná URL adresa: https://pdf.chat
  • Dokumenty v jazyku: PDF, Word, PowerPoint, text a obrázky (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat z: Odpovede s citáciami strán; prepisy prostredníctvom koncového bodu histórie
  • Spracovaný text von: txt, md, docx, pdf, csv, json
  • Čítacie motory: cpu (rýchle, tlačené dokumenty) a vlm (premium AI, rukopis, komplexné rozloženie, matematika)

Overenie pravosti

Overte sa pomocou svojho Token API (nájdite ho na vašom Stránka účtu) ako hlavička nosiča:

Authorization: Bearer YOUR_API_TOKEN

Môžete tiež prejsť ?api_token=… Používanie sa meria podľa zostatku stránok vo vašom účte.

Odošlite dokument

POST /api/v1/ocr/, Nahrávanie viacdielneho formulára.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Vráti úlohu. Pre súbory s ≤ 5 stranami je už done S textom; väčšie súbory sa vrátia pending/processing, dotazovať stav koncového bodu.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Získať výsledok

GET /api/v1/ocr/<uuid>/, hlasovanie do status je done alebo failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Stiahnutie formátu

GET /api/v1/ocr/<uuid>/download/?format=md, Exportujte výsledok. format Je jedným z txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat s dokumentom

Klásť otázky o dokončenej úlohe. Odpovede sú založené len na extrahovanom texte a citujú zdrojovú stránku. Vyžaduje token účtu, funkcia chat je bránená účtom.

POST /api/v1/chat/<uuid>/, JSON telo {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Vráti asistenta so správou, odpoveďou a zoznamom citovaných stránok:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, Načítať úplný prepis konverzácie pre prácu.

Príklady kódu

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Parametre

PoleTypOpis
filefilePovinné. Obrázok alebo PDF, ktoré sa majú spracovať.
tierstringcpu (predvolené, rýchle/tlačené) alebo vlm (premium AI: písanie rukou, rozloženie, matematika).
languagestringauto (predvolené) alebo kód jazyka (en, ch, ja, ar, …).
toolstringVoliteľný nástrojový zásobník (napr. summarize-pdf, ask-pdf) na pred-rámovanie chat pre túto úlohu.

Chyby & limity

KódVýznam
400Žiadny súbor, nepodporovaný typ alebo súbor príliš veľký.
401Chýbajúci alebo neplatný token API.
402Nedostali ste sa na požadovaný počet strán, dosiahli ste denný/mesačný limit bezplatných stránok alebo nemáte žiadne kredity. used/cap.
404Úloha UUID nebola nájdená.
409Stiahnutie požadované pred dokončením úlohy.

Každá spracovaná stránka stojí kredity (1 kredit na stranu v rýchlej úrovni, viac kreditov v prémiovej úrovni). Platené plány zvyšujú limity strán na súbor a pridávajú prioritu. stanovenie cien.

Často kladené otázky

Vytvorte si bezplatný účet a otvorte si Stránka účtu, váš token sa zobrazí s tlačidlo kopírovať.

Áno, súbory s 5 alebo menej stranami vrátia celý výsledok v odpovedi POST, takže pre väčšinu obrázkov a krátkych PDF nie je potrebné žiadne dotazovanie.

Viac ako 100, vrátane latinky, CJK, arabčiny, cyriliky a indickej abecedy. Použitie language=auto Na zistenie alebo odovzdanie špecifického kódu.

Nahrané dokumenty spracovávame len na účely odpovedania na vaše otázky a automaticky ich vymažeme.Nikdy nepredávame, nezdieľame ani neškolíme na vašich dokumentoch.

Používanie sa meria na stránku proti zostatku na vašom účte: anonymné hovory získajú denný príspevok na IP, bezplatné účty mesačný balík a platené plány používajú zakúpené kredity s vyšším limitom a prioritou stránok na súbor.Keď sa vám kredity vyčerpajú, dostanete 402 s použitým a limitom v tele.

Môžete posielať PNG, JPG, WEBP, GIF, BMP, TIFF a viacstranové PDF.Výsledky stiahnuť ako txt, md, docx, pdf (prehľadávateľné), csv alebo json prostredníctvom parametra formátu koncového bodu sťahovania.

400 je chýbajúci súbor, nepodporovaný typ alebo súbor príliš veľký; 401 chýbajúci alebo neplatný token; 402 out of pages; 404 neznáme UUID úlohy; a 409 sťahovanie požadované pred dokončením úlohy.Telá chýb obsahujú krátke hlásenie.

Objekt úlohy so stavom, úrovňou, jazykom, počtom strán a priemernou spoľahlivosťou, plus plným textom a označením.Pole strán rozdeľuje každú stranu na bloky s textom, ohraničujúcim rámčekom (bbox) a spoľahlivosťou na blok.

Použite vlm, prémiový AI engine, na rukopis, komplexné alebo viacstĺpcové rozloženia, matematiku a preklad, kde je oveľa presnejší.Používajte vlm, prémiový AI engine, na rukopis, komplexné alebo viacstĺpcové rozloženia, matematiku a preklad, kde je oveľa presnejší.

Odovzdajte nástroj so slugom (napríklad summarize-pdf alebo ask-pdf) na pred-rámovanie chat pre túto úlohu, takže asistent je naladený na zhrnutie alebo zodpovedanie otázok o dokumente.

Súbory s 5 alebo menej stránkami sa vrátia v POST odpovedi, väčšie súbory sa vrátia okamžite ako čakajúca alebo spracovávaná a vy môžete požiadať GET /api/v1/ocr/<uuid>/ kým stav nie je dokončený alebo zlyhal. Platené plány zvyšujú limit na stranu na súbor.

API je jednoduchý REST cez HTTPS, takže funguje z akéhokoľvek jazyka s HTTP klientom, pozri Python, Node.js a cURL príklady vyššie.Nie je potrebné inštalovať SDK; pár riadkov štandardného HTTP kódu je všetko, čo potrebujete.