PDF.chat API

Carica un PDF e chat con esso dalla tua app Hoppenstedt fare domande e ottenere risposte citate alla pagina, in 100+ lingue. Metered per pagina, senza sorprese.

Introduzione

L'API PDF.chat è una piccola interfaccia REST. POST un documento per ingerirlo e ottenere un lavoro con il testo del documento e una ripartizione per pagina (testo, caselle di delimitazione, fiducia). Poi si POST domande contro quel lavoro e ottenere risposte a terra nel documento, ciascuno citando la pagina da cui è venuto. Lavori di 5 pagine o meno ritorno in linea; lavori più grandi tornare immediatamente con un pending status che si poll fino done.

  • URL base: https://pdf.chat
  • Documenti in: PDF, più Word, PowerPoint, testo e immagini (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat fuori: risposte con citazioni di pagina; trascrizioni tramite l'endpoint della cronologia
  • Testo elaborato: txt, md, docx, pdf, csv, json
  • Motori di lettura: cpu (documenti stampati e veloci) e vlm (I.A. premium, scrittura a mano, layout complesso, matematica)

Autenticazione

Autentica con il tuo Token API (trovalo sul tuo pagina account) come intestazione Bearer:

Authorization: Bearer YOUR_API_TOKEN

Puoi anche passare ?api_token=… come parametro di interrogazione. L'utilizzo è misurato rispetto al saldo della pagina del tuo account.

Invia un documento

POST /api/v1/ocr/, Caricamento del modulo multipart.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Restituisce il lavoro. Per i file ≤5 pagine è già done con il testo; file più grandi tornano pending/processing, sondaggio l'endpoint di stato.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Ottieni un risultato

GET /api/v1/ocr/<uuid>/, sondaggio fino status è done oppure failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Scaricare un formato

GET /api/v1/ocr/<uuid>/download/?format=md, esportare il risultato. format è uno dei txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat con un documento

Fai domande su un lavoro finito. Le risposte sono basate solo sul testo estratto e cita la pagina sorgente. Richiede un token di account, la funzione chat è account-gated.

POST /api/v1/chat/<uuid>/, Corpo JSON {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Restituisce il messaggio assistente con la sua risposta e un elenco delle pagine citate:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, Prendi la trascrizione completa della conversazione per un lavoro.

Esempi di codice

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Parametri

CampoTipoDesignazione delle merci
filefileRichiesto. L'immagine o PDF da elaborare.
tierstringcpu (predefinito, veloce/stampato) o vlm (premium AI: scrittura, layout, matematica).
languagestringauto (predefinito) o un codice linguistico (en, ch, ja, ar,...).
toolstringLumaca opzionale (ad esempio summarize-pdf, ask-pdf) per pre-incorniciare gli chat per tale compito.

& Limiti errori

CodiceSignificato
400Nessun file, tipo non supportato, o file troppo grande.
401Token API mancante o non valido.
402Il limite giornaliero/mensile di esenzione raggiunto o non ha ricevuto crediti. used/cap.
404Job UUID non trovato.
409Scaricare richiesto prima del lavoro finito.

Ogni pagina trattata costi crediti (1/pagina sul livello veloce, più premium). piani pagati alzare per file pagina tappi e aggiungere priorità. Vedere prezzi.

Domande frequenti

Crea un account gratuito e apri il tuo pagina account, il tuo gettone è mostrato lì con un pulsante copia.

Sì, file di 5 pagine o meno restituiscono il risultato completo in linea nella risposta POST, quindi non è necessario alcun sondaggio per la maggior parte delle immagini e dei PDF brevi.

Oltre 100, tra cui latino, CJK, arabo, cirillico e scritti indici. language=auto per rilevare o passare un codice specifico.

I caricamenti vengono elaborati solo per rispondere alle tue domande e cancellati automaticamente. Non vendiamo, non condividiamo o non ci alleniamo mai sui tuoi documenti.

L'utilizzo è misurato per pagina contro il saldo del tuo account: chiamate anonime ottenere un'indennità giornaliera per IP, account gratuiti un secchio mensile, e piani a pagamento utilizzano crediti acquistati con massimali di pagina per file più elevati e priorità. Quando si esaurisce si ottiene un 402 con usato e tappo nel corpo.

Puoi inviare PNG, JPG, WEBP, GIF, BMP, TIFF e PDF multi-pagina. Scarica i risultati come txt, md, docx, pdf (searchable), csv, o json tramite il parametro di formato dell'endpoint di download.

400 è un file mancante, un tipo non supportato o un file troppo grande; 401 un token mancante o non valido; 402 su pagine; 404 un job sconosciuto UUID; e 409 un download richiesto prima che il lavoro sia terminato. I corpi di errore includono un breve messaggio.

Un oggetto di lavoro con stato, livello, lingua, page_count e mean_confidence, più il testo completo e il markdown. L'array delle pagine rompe ogni pagina in blocchi con il testo, la casella di delimitazione (bbox) e la sicurezza per blocco.

Utilizzare cpu (il valore predefinito) per il riconoscimento rapido e a basso costo dei documenti stampati puliti. Usare vlm, il motore AI premium, per la scrittura a mano, layout complessi o multi-colonne, matematica e traduzione, dove è molto più preciso.

Passare lo strumento con una lumaca (ad esempio sommare-pdf o chiedere-pdf) per pre-incorniciare gli chat per tale compito, quindi l'assistente è sintonizzato per riassumere o rispondere alle domande sul documento.

File di 5 pagine o meno ritorno in linea nella risposta POST. File più grandi tornare immediatamente come in sospeso o elaborazione, e si sondaggio GET /api/v1/ocr/<uuid>/ fino a che lo stato non è stato fatto o non è stato raggiunto. I piani pagati aumentano il tappo della pagina per file.

L'API è semplice REST su HTTPS, quindi funziona da qualsiasi lingua con un client HTTP, vedere gli esempi di Python, Node.js e cURL sopra. Non c'è SDK da installare; alcune righe di codice HTTP standard sono tutto ciò di cui avete bisogno.