PDF.chat API

Включи PDF и chat с него от собственото си приложение — задават въпроси и получават отговори, цитирани на страницата, на 100+ езици. Измерени на страница, без изненади.

Преглед

PDF.chat API е малък интерфейс REST. Първо вие POST документ за поглъщане и получаване на работа с текста на документа и разпадане на всяка страница (текст, гранични кутии, увереност). След това вие POST въпроси срещу тази работа и получаване на отговори, основани в документа, всяка цитирайки страницата, от която е дошъл. Работа с 5 страници или по-малко завръщане на линия; по-големи работни места се завърна незабавно с pending статус, който сте проучили до done.

  • Основен URL: https://pdf.chat
  • Документи в: PDF, плюс Word, PowerPoint, текст и изображения (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat отвън: отговори с страници цитати; транскрипти през крайната точка на историята
  • Обработен текст: txt, md, docx, pdf, csv, json
  • Четещи двигатели: cpu (бързи, печатани документи) и vlm (премиум АИ, почерк, сложена схема, математика)

Автентифициране

Автентифицирайте се с вашия API- знак (Намери го на твоята страница на сметката) като глава на носителя:

Authorization: Bearer YOUR_API_TOKEN

Можете също да минете. ?api_token=… като параметр за изпитание. Използването е измервано в зависимост от баланса на страницата на вашата сметка.

Изпращане на документ

POST /api/v1/ocr/, Изпращане на многочастна форма.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Връща задачата. За файлове с ≤5 страници вече е done с текста; се връщат по- големи файлове pending/processing, да се проучи състоянието крайната точка.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Вземи резултат

GET /api/v1/ocr/<uuid>/, до status е done или failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Изтеглете формат

GET /api/v1/ocr/<uuid>/download/?format=md, изнесете резултата. format е един от txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat с документ

Задавате въпроси за завършена работа. Отговорите са основани само в извлечения текст и цитира източника страница. Изисква жетон на сметката, функция chat е акаунт.

POST /api/v1/chat/<uuid>/, Тяло на JSON {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Връща помощното съобщение с отговора си и списък с цитираните страници:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, Донеси пълния разговор за работа.

Примери за код

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Параметри

ПолеТипОписание
filefileЗадължително. Образът или PDF за процес.
tierstringcpu (по подразбиране, бързо/отпечатано) или vlm (премиум ВИ: почерк, изложба, математика).
languagestringauto (по подразбиране) или езиков код (en, ch, ja, ar,...).
toolstringОпционален инструмент за пълнене (напр. summarize-pdf, ask-pdf) да предвари chat за тази задача.

Грешка и ограничения

КодОзначение
400Няма файл, неподдържан тип или файл твърде голям.
401Липсващ или невалиден API- жетон.
402От страници, дневно/месечно свободно лимит, или без кредити. used/cap.
404Заданието UUID не е намерено.
409Изтеглите поискани преди да завършите работата.

Всяка страница обработени разходни кредити (1/страница на бързо ниво, повече на премия). Платените планове повишават за файлови капаци и добавят приоритет. ценообразуване.

Често задавани въпроси

Създайте безплатна сметка и отворите вашия страница на сметката, жетонът ви е показан там с бутон за копие.

Да, файлове от 5 страници или по-малко връщане на пълния резултат в отговора на POST, така че не е необходимо анкетиране за повечето изображения и къси PDF.

Над 100, включително латински, CJK, арабски, кирилициндийски скриптове. language=auto да засечете или да предадете специфичен код.

Качителите се обработват само за да отговарят на вашите въпросизтриват автоматично. Ние никога не продаваме, споделяме или тренираме по вашите документи.

Използването е измервано на страница срещу баланса на вашата сметка: анонимни обаждания получават на дневна помощ за IP, безплатни сметки месечна кофи, и платени планове използване закупени кредити с по-високи на страницата капаци и приоритет. Когато се изтичат, получавате 402 с използван и капачка в тялото.

Можете да изпратите PNG, JPG, WEBP, GIF, BMP, TIFF и многостраничен PDF. Резултати за изтегляне като txt, md, docx, pdf (изследователски), csv или json чрез параметъра на изтегляне крайната точка.

400 е липсващ файл, неподкрепен тип, или файл твърде голям; 401 липсващ или невалиден жетон; 402 от страници; 404 неизвестна задача UUID; и 409 изтегляне, поискано преди завършването на работата. Телата на грешки включват кратко съобщение.

Обект за работа със статус, ниво, език, page_count и средна_ увереност, плюс целия текст и маркиране. Стр. масивът разбива всяка страница на блокове с текст, граничиво поле (bbox) и доверие на блок.

Използвайте cpu (по подразбиране) за бързо, ниско разходи разпознаване на чисти печатни документи. Използвайте vlm, премиум AL двигател, за почерк, сложни или многоколонкови графики, математика, и превод, където е далеч по-точно.

Прехвърляне инструмент с куршум (например обобщение-pdf или питане-pdf) за предварително оформление на chat за тази задача, така че асистентът е настроен да обобщи или отговори на въпросите за документа.

Файлове от 5 страници или по-малко връщане в отговора на POST. По-големи файлове се връщат незабавно като очакване или обработка, и вие анкета GET /api/v1/okr/<uuid>/ докато не се направи или не се провали. Платените планове повишават за файл капачката.

API е обикновен REST върху HTTPS, така че работи от всеки език с HTTP клиент, вижте Python, Node.js и cURL примери по-горе. Няма SDK за инсталиране; няколко реда на стандартен HTTP код са всичко, което ви трябва.