PDF.chat API

Pošaljite PDF i chat s njim iz vlastite aplikacije – postavljajte pitanja i dobiti odgovore navedene na stranici, na 100+ jezika. Mjere se po stranici, bez iznenađenja.

Pregled

PDF.chat API je malo REST sučelje. Prvo vi POST dokument za progutanje i dobiti natrag posao s tekstom dokumenta i razlomom po stranici (tekst, okviri za ograničenje, samopouzdanje). Zatim ste vi POST pitanja protiv tog posla i dobiti odgovore temeljeno u dokumentu, svaka navodeći stranicu koja je došla iz. Radovi od 5 stranica ili manje povratka u liniji; veći poslovi vraćaju odmah s pending status koji ispitujete do done.

  • Osnovni URL: https://pdf.chat
  • Dokumenti u: PDF, plus Word, PowerPoint, tekst i slike (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat van: odgovore s citatima stranice; transkripti kroz ishod povijesti
  • Obrađivani tekst: txt, md, docx, pdf, csv, json
  • Čitanje motora: cpu (brzo, tiskani docs) i vlm (premij AI, rukopis, složen raspored, matematika)

Ovjera

Autentifikacija sa svojim API token (Nađi ga na svom account page) kao Nositelj zaglavlje:

Authorization: Bearer YOUR_API_TOKEN

Možete proći i ?api_token=… kao parametar upita. Upotreba je mjerila prema saldu stranice vašeg računa.

Pošalji dokument

POST /api/v1/ocr/, Višedijelni oblik upload.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Vraća zadatak. Za datoteke ≤5 stranice već je done s tekstom; veće datoteke se vraćaju pending/processing, ispitati ishod stanja.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Dobiti rezultat

GET /api/v1/ocr/<uuid>/, anketa do status je done ili failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Preuzmi format

GET /api/v1/ocr/<uuid>/download/?format=md, izvozi rezultat. format je jedan od txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat s dokumentom

Postavlja pitanja o završetku posla. Odgovori su utemeljiti samo u izvučenom tekstu i navesti izvornu stranicu. Zahtjeva žeton računa, chat značajka je račun-gated.

POST /api/v1/chat/<uuid>/, JSON tijelo {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Vraća pomoćnu poruku sa svojim odgovorom i popisom navedenih stranica:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, Donesi cijeli razgovor transkripta za posao.

Primjeri koda

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Parametri

PoljeTipOpis
filefile-Dogovoreno. Slika ili PDF za obradu.
tierstringcpu (uobičajeno, brzo/printirano) ili vlm (premij AL: rukopis, raspored, matematika).
languagestringauto (zadano) ili jezikovni kod (en, ch, ja, ar,...).
toolstringPopunjavanje u skladu s člankom 2. stavkom 1. točkom (a) summarize-pdf, ask-pdf) unaprijed okvir chat za taj zadatak.

Greška & ograničenja

ŠifraZnačenje
400Nema datoteke, nepodržana vrsta ili datoteka prevelika.
401Nedostaje ili neispravan API token.
402Od stranica, dnevno/mjesečno besplatno ograničenje dostignuto, ili nema kredita. Tijelo uključuje used/cap.
404Posao UUID nije pronađen.
409Preuzimanje zahtjevano prije završetka posla.

Svaka stranica obrada troškova kredita (1/stranica na brzi stupanj, više na premiju). Plaćeni planovi povećanje po datoteci caps i dodavanje prioriteta. Vidi cijene.

Česta pitanja

Napravite besplatni račun i otvorite svoj account page, vaš žeton je prikazan s tipkom za kopiju.

Da, datoteke od 5 stranica ili manje vraćaju punu rezultat u odgovoru POST, tako da nije potrebno anketa za većinu slika i kratke PDF-a.

Preko 100, uključujući latinski, CJK, arapski, ćirilica i indski skripti. language=auto za otkrivanje ili proslijediti određeni kod.

Upisi se obrađuju samo da bi odgovorili na vaša pitanja i izbrisali automatski. Mi nikada ne prodajemo, dijelimo ili treniramo na vašim dokumentima.

Upotreba je mjerio po stranici prema vašem računu bilans: anonimni pozivi dobivaju per-IP dnevni džeparac, besplatni računi mjesečno kantu, i plaćeni planovi korištenje kupljene kredite s većim po-datoteka kape i prioritet. Kada ste pokrenuti dobivate 402 s korištenjem i kapom u tijelu.

Možete poslati PNG, JPG, WEBP, GIF, BMP, TIFF i višestranica PDF. Rezultati preuzimanja kao txt, md, docx, pdf (pretraživanje), csv, ili json kroz parametre ishoda preuzimanja.

400 je fajl, nepodržan tip, ili datoteka prevelika; 401 nedostaje ili neispravan žeton; 402 od stranica; 404 nepoznat posao UUID; i 409 preuzimanje zatražio prije završetka posla. Tijela greške uključuju kratku poruku.

Objekt posla sa statusom, stupnjem, jezikom, stranicom_povjerljivost i srednjim pouzdanjem, plus cijeli tekst i oznaka. Stranice niz razbija svaku stranicu u blokove sa svojim tekstom, okvirom za ograničenje (bbox) i povjerenje po bloku.

Koristite cpu (uobičajeno) za brzo, nisko troškovno prepoznavanje čistih tiskana dokumenta. Koristite vlm, premium AI motor, za rukopis, složeni ili višestruki rasporedi, matematika, i prijevod, gdje je daleko točnije.

Alat za provjeru s pužem (na primjer sažetak-pdf ili ask-pdf) unaprijed okvir chat za taj zadatak, pa je pomoćnik nastavljen da sažete ili odgovorite na pitanja o dokumentu.

Datoteke s 5 stranica ili manje povratka u odgovoru POST. Veći datoteke se odmah vraćaju kao u čekanju ili obradi, a vi anketu GET /api/v1/okr/<uuid>/ dok se status ne završi ili ne uspije. Plaćeni planovi podignuti po polju stranice.

API je obično REST preko HTTPS, tako da radi iz bilo kojeg jezika s HTTP klijentom, pogledajte Python, Node.js, i cURL primjere gore. Nema SDK za instaliranje; nekoliko linija standardnog HTTP koda su sve što trebate.