PDF.chat API

Բեռնել PDF և chat-ը դրա հետ ձեր սեփական ծրագրից — հարցնել և ստանալ պատասխաններ, որոնք մեջբերված են էջում, 100+ լեզուներով։ Մոտավորապես էջը մեկ, ոչ մի զարմանք։

Համառոտ

PDF.chat API- ն փոքր REST ինտերֆեյս է։ Առաջին հերթին դուք պետք է POST փաստաթուղթ, որպեսզի այն ներառվի և վերադարձվի փաստաթղթի տեքստի և էջերի բաժանման (տեքստի, սահմանափակման տուփերի, վստահության) աշխատանքը։ Այնուհետև դուք կարող եք POST հարցումներ այդ աշխատանքի վերաբերյալ և ստանալ պատասխաններ փաստաթղթի վրա հիմնված, յուրաքանչյուրը նշելով էջը, որտեղից այն եկել է։ 5 էջ կամ ավելի քիչ աշխատանքները վերադարձվում են ինտերնետում։ Մեծ աշխատանքները վերադարձվում են անմիջապես ՝ ՝ pending վիճակ, որը դուք հարցում եք կատարում մինչև done.

  • Բնական URL: https://pdf.chat
  • Փաստաթղթեր PDF, ինչպես նաև Word, PowerPoint, տեքստեր և նկարներ (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat դուրս: պատասխաններ էջերի մեջբերումներով; տեքստեր պատմության վերջնական կետով
  • Ընդունված տեքստը: txt, md, docx, pdf, csv, json
  • Կարդալ սարքեր cpu (արագ, տպված փաստաթղթեր) և vlm (Premium AI, գրելը ձեռքով, բարդ դասավորություն, մաթեմատիկա)

Ավտոմատացում

Ավտոմատացված API տոկոսադրույք (գտնեք այն ձեր հաշիվ) որպես Bearer գլխամաս:

Authorization: Bearer YOUR_API_TOKEN

Դուք կարող եք նաև անցնել ?api_token=… որպես հարցման պարամետր։ Կիրառումը հաշվարկվում է ձեր հաշվի էջերի հաշվեկշռի համաձայն։

Տեղադրել փաստաթուղթ

POST /api/v1/ocr/, Ընդունելություն

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Վերադարձնում է աշխատանքը։ ≤5- էջանոց ֆայլերի համար այն արդեն պատրաստ է done տեքստի հետ, ավելի մեծ ֆայլերը վերադարձվում են pending/processing, հարցում վիճակի վերջնական կետ

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Գրանցել արդյունքը

GET /api/v1/ocr/<uuid>/, հարցում մինչև status է done կամ failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Տեղադրել ֆորմատը

GET /api/v1/ocr/<uuid>/download/?format=md, արտահանել արդյունքը format մեկը txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat փաստաթղթով

Հարցեր տալ ավարտված աշխատանքի մասին։ Պատասխանները հիմնված են միայն դուրս բերված տեքստում և մեջբերում են աղբյուրի էջը։ Պահանջվում է հաշվի տոկեն, chat հատկությունը հաշվի տոկեն է։

POST /api/v1/chat/<uuid>/, JSON մարմին {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Վերադարձնում է օգնականի հաղորդագրությունը՝ իր պատասխանով և մեջբերված էջերի ցանկով:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, ստանալ աշխատանքի համար խոսակցության ամբողջական տեքստը։

Կոդային օրինակներ

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Փարատոմսեր

ՏեղամասերՏեսակԱպրանքանիշ
filefileՊահանջվում է Տեսանյութը կամ PDF- ը, որը պետք է պրոցեսավորվի։
tierstringcpu (լռելյայն, արագ/տպված) կամ vlm (Premium AI: գրել, դասավորել, մաթեմատիկա)
languagestringauto (լռելյայն) կամ լեզվի կոդ (en, ch, ja, ar,...).
toolstringԱռաջարկվող գործիքային slug-ը (օրինակ. summarize-pdf, ask-pdfchat-ը նախապատրաստել այդ գործողության համար։

Սխալներ և սահմանափակումներ

Կոդիմաստ
400Ֆայլ չկա, աջակցված չէ տիպի կամ Ֆայլը չափազանց մեծ է
401Հաշվառված կամ օրինական API token-ը բացակայում է։
402էջեր չկան, օրական/ամսական ազատ թողունակության սահմանը հասցվել է կամ ոչ մի վարկ չի տրվել։ Տեղեկությունը ներառում է used/cap.
404Ընթացիկ աշխատանքի UUID- ը չի հայտնաբերվել։
409Հեռացվել է աշխատանքը ավարտելուց առաջ

Յուրաքանչյուր էջը արժե վարկ (1/էջ արագ մակարդակով, ավելի շատ premium-ի դեպքում)։ Պետք է վճարել յուրաքանչյուր ֆայլի համար և ավելացնել առաջնահերթությունը։ Դիտեք արժեք.

Հաճախակի տրվող հարցեր

Ստեղծեք անվճար հաշիվ և բացեք ձեր հաշիվ, ձեր տոկոսը ցույց է տրվում այնտեղ` կպցնելու կոճակով:

Այո, 5 էջ կամ ավելի քիչ չափսերի ֆայլերը POST պատասխանում ետ են տալիս ամբողջական արդյունքը, այնպես որ պատկերների և կարճ PDF- ների մեծամասնության համար հարցում չի պահանջվում։

100-ից ավելի, ներառյալ լատինական, CJK, արաբական, կիրիլինգ և հնդկական գրառումներ։ language=auto Ձեր ազգանունը:

Առաջարկվող նյութերը վերբեռնվում են միայն ձեր հարցերին պատասխանելու համար և ավտոմատ կերպով ջնջվում են։ Մենք երբեք չենք վաճառի, կիսվի կամ ուսումնասիրի ձեր փաստաթղթերը։

Օգտագործումը հաշվարկվում է յուրաքանչյուր էջի համար ձեր հաշվի հաշվին. անանուն զանգերը ստանում են յուրաքանչյուր IP-ի համար օրական գումար, անվճար հաշիվները` ամսական գումար, իսկ վճարովի պլանները օգտագործում են գնված վարկային քարտեր յուրաքանչյուր ֆայլի համար ավելի բարձր էջերի սահմանափակումներով և առաջնահերթությամբ։ Երբ գումարը սպառվում է, դուք ստանում եք 402-ի նամակ՝ մարմնի մեջ օգտագործված և սահմանափակված էջերով։

Դուք կարող եք ուղարկել PNG, JPG, WEBP, GIF, BMP, TIFF և բազմէջ PDF ֆայլեր։ Պատասխանները կարող են ներբեռնվել txt, md, docx, pdf (հետախուզման հնարավորություն), csv կամ json ձևաչափերով՝ ներբեռնման վերջնական կետի ձևաչափի պարամետրի միջոցով։

400-ը բացակայող ֆայլ է, աջակցված չէ կամ ֆայլը չափազանց մեծ է, 401-ը բացակայող կամ օրինական տոկոսադրույք է, 402-ը էջերի քանակից դուրս է, 404-ը անհայտ աշխատանքի UUID է, և 409-ը պահանջված է աշխատանքի ավարտից առաջ ներբեռնել։ Սխալի մարմինը ներառում է կարճ հաղորդագրություն։

Աշխատանքի օբյեկտ, որը պարունակում է վիճակ, մակարդակ, լեզու, էջերի_համար և միջին_վստահություն, ինչպես նաև ամբողջական տեքստը և նշանագրերը։ Էջերի շարքը յուրաքանչյուր էջը բաժանում է բլոկների՝ իրենց տեքստի, սահմանափակման տուփի (bbox) և յուրաքանչյուր բլոկի վստահության համաձայն։

Կիրառել cpu- ն (լռելյայն) արագ, ցածր ծախսերով տպագրված փաստաթղթերի ճանաչման համար։ Կիրառել vlm- ն, բարձրորակ AI սարքը, ձեռքով գրելու, բարդ կամ բազմակողմանի դասավորությունների, մաթեմատիկայի և թարգմանության համար, որտեղ այն ավելի ճշգրիտ է։

Տեղադրել գործիք slug-ով (օրինակ summarize-pdf կամ ask-pdf) chat-ը նախապատրաստելու համար այդ գործողության համար, որպեսզի օգնականը համապատասխանի փաստաթղթի վերաբերյալ ընդհանուր տեղեկությունների կամ հարցերի պատասխանների համար։

5 էջ կամ ավելի քիչ չափսերի ֆայլերը POST պատասխանում ետ են գալիս ինտերնետում։ Մեծ ֆայլերը անմիջապես վերադարձվում են որպես սպասարկվող կամ պրոցեսավորվող, և դուք հարցում եք կատարում GET /api/v1/ocr/<uuid>/ մինչև վիճակը կատարված կամ ձախողված լինի։ Պետք է վճարել յուրաքանչյուր ֆայլի համար էջերի սահմանափակումը։

API-ն պարզ REST է HTTPS-ի վրա, այնպես որ այն աշխատում է ցանկացած լեզվից HTTP կրեդիտի միջոցով, տե՛ս Python, Node.js և cURL օրինակները վերևում։ Չկա տեղադրելու SDK, ստանդարտ HTTP կոդի մի քանի տողեր են այն ամենը, ինչ ձեզ հարկավոր է։