PDF.chat API

Tölts fel egy PDF-et és chat-et a saját alkalmazásodból • kérdezz és válaszolj az oldalra, 100+ nyelven. Oldalonként mérve, nem lep meg.

Áttekintés

A PDF.chat API egy kis REST interfész. Először is, POST egy dokumentum, hogy lenyelje, és kap vissza egy munkát a dokumentum szöveg és egy oldalonkénti bontás (szöveg, kötöző dobozok, magabiztosság). POST kérdések ellen, hogy a munkát, és kap válaszokat alapozott a dokumentumban, minden idézve az oldal jött. Jobs 5 oldal vagy kevesebb visszatér a vonalban; nagyobb munkahelyek visszatérnek azonnal egy pending a szavazási státusz, amíg done.

  • Alap URL: https://pdf.chat
  • Dokumentumok: PDF, plusz Word, PowerPoint, szöveg és képek (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat kiesett: válaszok oldal idézéssel; átiratok a történelem végpontján keresztül
  • Feldolgozott szöveg: txt, md, docx, pdf, csv, json
  • Olvasómotorok: cpu (gyors, nyomtatott dokumentumok) és vlm (Premium MI, kézírás, komplex elrendezés, matek)

Hitelesítés

Hitelesítés a API-token (találd meg a A számlaoldal) mint a Beader fejléc:

Authorization: Bearer YOUR_API_TOKEN

- Át is mehetsz. ?api_token=… a felhasználói oldal egyenlegét mérik.

Dokumentum benyújtása

POST /api/v1/ocr/, többrészes űrlap feltöltése.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Visszaadja a munkát. ≤5 oldalas fájlok esetén már done a szöveg; nagyobb fájlok jönnek vissza pending/processing, a státusz végpontjának vizsgálata.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Eredmény

GET /api/v1/ocr/<uuid>/, a szavazást addig, amíg status ng done vagy failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Formátum letöltése

GET /api/v1/ocr/<uuid>/download/?format=md, exportálja az eredményt. format az egyik txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat egy dokumentummal

A válaszok csak a kivont szövegben vannak alapítva, és a forrásoldalt idézik. Számlajegyet igényel, a chat funkció számla-tag.

POST /api/v1/chat/<uuid>/, JSON test {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Válaszával és az idézett oldalakkal adja vissza az asszisztens üzenetét:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, Hozd a teljes beszélgetés átiratát egy állásra.

Kód példák

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Paraméterek

MezőTípusLeírás
filefileSzükséges. A feldolgozáshoz szükséges kép vagy PDF.
tierstringcpu (alapértelmezett, gyors/nyomtatott) vagy vlm (premium MI: kézírás, elrendezés, matematika).
languagestringauto (alapértelmezett) vagy nyelvi kód (en, ch, ja, ar,...).
toolstringOpcionális szerszámgomba (pl. summarize-pdf, ask-pdf) előre a chat-es feladat.

Hibahatár

KódJelentés
400Nincs fájl, nem támogatott típus, vagy túl nagy.
401Hiányzó vagy érvénytelen API-jel.
402Oldalakon kívül, napi/havi ingyenes limitet elért, vagy nem kreditek. A szerv tartalmazza used/cap.
404Job UUID nem található.
409Letöltést kért a munka befejezése előtt.

Minden oldal feldolgozott költségkreditek (1/oldal a gyors szint, több a prémium). A fizetett tervek emelnek egy fájllapon és adjunk hozzá prioritást. ár.

Gyakran feltett kérdések

Hozzon létre egy ingyenes fiókot és nyissa meg A számlaoldalA zsetonod egy másoló gombbal van odaírva.

Igen, a fájlok 5 oldal vagy kevesebb vissza a teljes eredmény sor a POST válasz, így nincs szükség közvélemény-kutatás a legtöbb kép és rövid PDF.

Több mint 100, beleértve a latin, CJK, arab, cirill és indic szkripteket. language=auto hogy észlelje vagy átadjon egy adott kódot.

A feltöltéseket csak a kérdéseire való válaszadásra és a törlésre dolgozzuk fel. Sosem adjuk el, osztjuk meg vagy képezzük ki a dokumentumait.

A felhasználó oldalonként méri a számlaegyenlegét: anonim hívások napi egy IP-díj, ingyenes számlák havi vödör, és fizetett tervek segítségével vásárolt kreditek magasabb per fájllap és prioritás. Amikor kifogy, kap egy 402 használt és a felső a szervezetben.

A PNG, JPG, WEBP, GIF, BMP, TIFF és több oldalas PDF-t küldhet. Eredmények letöltése txt, MD, docx, pdf (keresés), csv vagy json segítségével a letöltési végpont formátum paraméter.

400 egy hiányzó fájl, nem támogatott típusú, vagy fájl túl nagy; 401 egy hiányzó vagy érvénytelen token; 402 az oldalakon; 404 egy ismeretlen munka UUID; és 409 egy letöltés kért előtt a munka befejeződött. Hibaszervek tartalmaz egy rövid üzenetet.

Egy állás objektum státuszsal, szinttel, nyelvvel, page_count-kal és mean_confidence-el, plusz a teljes szöveg és a lejelölés. Az oldalak tömbje minden oldalt blokkokra bontja szövegükkel, bbox-kal és blokkonként való megbízhatóságukkal.

Használja a cpu (az alapértelmezett) gyors, olcsó felismerése tiszta nyomtatott dokumentumok. Használja vlm, a prémium MI motor, a kézírás, komplex vagy többoszlopos elrendezések, matematika, és a fordítás, ahol sokkal pontosabb.

Pass eszköz egy lövedék (például összefoglaló-pdf vagy ask-pdf) előframe a chat erre a feladatra, így az asszisztens hangolja össze, vagy válaszol a kérdésekre a dokumentum.

A POS-válaszban 5 vagy kevesebb oldalnyi fájlt kell visszaadni. A nagyobb fájlok azonnal visszajönnek, mint folyamatban lévő vagy feldolgozott, és Ön a GET /api/v1/ocr/-t keresi.<uuid>/ amíg a státusz megtörtént vagy sikertelen. Fizetett tervek emelje a per-file oldal sapka.

Az API egyszerű REST over HTTPS, így működik minden nyelven egy HTTP kliens, lásd a Python, Node.js, és cURL példák felett. Nincs SDK telepíteni; néhány sor standard HTTP kód van minden, amire szükséged.