Quanto grande posso inviare un file e come vengono gestiti i grandi lavori?

File di 5 pagine o meno ritorno in linea nella risposta POST. File più grandi tornare immediatamente come in sospeso o elaborazione, e si sondaggio GET /api/v1/ocr/ / fino a che lo stato non è stato fatto o non è stato raggiunto. I piani pagati aumentano il tappo della pagina per file.

PDF.chat API

Introduzione

L'API PDF.chat è una piccola interfaccia REST. POST un documento per ingerirlo e ottenere un lavoro con il testo del documento e una ripartizione per pagina (testo, caselle di delimitazione, fiducia). Poi si POST domande contro quel lavoro e ottenere risposte a terra nel documento, ciascuno citando la pagina da cui è venuto. Lavori di 5 pagine o meno ritorno in linea; lavori più grandi tornare immediatamente con un pending status che si poll fino done.

URL base: https://pdf.chat
Documenti in: PDF, più Word, PowerPoint, testo e immagini (PNG, JPG, WEBP, GIF, BMP, TIFF)
Chat fuori: risposte con citazioni di pagina; trascrizioni tramite l'endpoint della cronologia
Testo elaborato: txt, md, docx, pdf, csv, json
Motori di lettura: cpu (documenti stampati e veloci) e vlm (I.A. premium, scrittura a mano, layout complesso, matematica)

Autenticazione

Autentica con il tuo Token API (trovalo sul tuo pagina account) come intestazione Bearer:

Authorization: Bearer YOUR_API_TOKEN

Puoi anche passare ?api_token=… come parametro di interrogazione. L'utilizzo è misurato rispetto al saldo della pagina del tuo account.

Invia un documento

POST /api/v1/ocr/, Caricamento del modulo multipart.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Restituisce il lavoro. Per i file ≤5 pagine è già done con il testo; file più grandi tornano pending/processing, sondaggio l'endpoint di stato.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Ottieni un risultato

GET /api/v1/ocr/<uuid>/, sondaggio fino status è done oppure failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Scaricare un formato

GET /api/v1/ocr/<uuid>/download/?format=md, esportare il risultato. format è uno dei txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat con un documento

Fai domande su un lavoro finito. Le risposte sono basate solo sul testo estratto e cita la pagina sorgente. Richiede un token di account, la funzione chat è account-gated.

POST /api/v1/chat/<uuid>/, Corpo JSON {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Restituisce il messaggio assistente con la sua risposta e un elenco delle pagine citate:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, Prendi la trascrizione completa della conversazione per un lavoro.

Esempi di codice

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])

import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);

# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Parametri

Campo	Tipo	Designazione delle merci
`file`	file	Richiesto. L'immagine o PDF da elaborare.
`tier`	string	`cpu` (predefinito, veloce/stampato) o `vlm` (premium AI: scrittura, layout, matematica).
`language`	string	`auto` (predefinito) o un codice linguistico (`en`, `ch`, `ja`, `ar`,...).
`tool`	string	Lumaca opzionale (ad esempio `summarize-pdf`, `ask-pdf`) per pre-incorniciare gli chat per tale compito.

& Limiti errori

Codice	Significato
`400`	Nessun file, tipo non supportato, o file troppo grande.
`401`	Token API mancante o non valido.
`402`	Il limite giornaliero/mensile di esenzione raggiunto o non ha ricevuto crediti. `used`/`cap`.
`404`	Job UUID non trovato.
`409`	Scaricare richiesto prima del lavoro finito.

Ogni pagina trattata costi crediti (1/pagina sul livello veloce, più premium). piani pagati alzare per file pagina tappi e aggiungere priorità. Vedere prezzi.

Domande frequenti

Crea un account gratuito e apri il tuo pagina account, il tuo gettone è mostrato lì con un pulsante copia.

Sì, file di 5 pagine o meno restituiscono il risultato completo in linea nella risposta POST, quindi non è necessario alcun sondaggio per la maggior parte delle immagini e dei PDF brevi.

Oltre 100, tra cui latino, CJK, arabo, cirillico e scritti indici. language=auto per rilevare o passare un codice specifico.

I caricamenti vengono elaborati solo per rispondere alle tue domande e cancellati automaticamente. Non vendiamo, non condividiamo o non ci alleniamo mai sui tuoi documenti.

L'utilizzo è misurato per pagina contro il saldo del tuo account: chiamate anonime ottenere un'indennità giornaliera per IP, account gratuiti un secchio mensile, e piani a pagamento utilizzano crediti acquistati con massimali di pagina per file più elevati e priorità. Quando si esaurisce si ottiene un 402 con usato e tappo nel corpo.

Puoi inviare PNG, JPG, WEBP, GIF, BMP, TIFF e PDF multi-pagina. Scarica i risultati come txt, md, docx, pdf (searchable), csv, o json tramite il parametro di formato dell'endpoint di download.

400 è un file mancante, un tipo non supportato o un file troppo grande; 401 un token mancante o non valido; 402 su pagine; 404 un job sconosciuto UUID; e 409 un download richiesto prima che il lavoro sia terminato. I corpi di errore includono un breve messaggio.

Un oggetto di lavoro con stato, livello, lingua, page_count e mean_confidence, più il testo completo e il markdown. L'array delle pagine rompe ogni pagina in blocchi con il testo, la casella di delimitazione (bbox) e la sicurezza per blocco.

Utilizzare cpu (il valore predefinito) per il riconoscimento rapido e a basso costo dei documenti stampati puliti. Usare vlm, il motore AI premium, per la scrittura a mano, layout complessi o multi-colonne, matematica e traduzione, dove è molto più preciso.

Passare lo strumento con una lumaca (ad esempio sommare-pdf o chiedere-pdf) per pre-incorniciare gli chat per tale compito, quindi l'assistente è sintonizzato per riassumere o rispondere alle domande sul documento.

File di 5 pagine o meno ritorno in linea nella risposta POST. File più grandi tornare immediatamente come in sospeso o elaborazione, e si sondaggio GET /api/v1/ocr/<uuid>/ fino a che lo stato non è stato fatto o non è stato raggiunto. I piani pagati aumentano il tappo della pagina per file.

L'API è semplice REST su HTTPS, quindi funziona da qualsiasi lingua con un client HTTP, vedere gli esempi di Python, Node.js e cURL sopra. Non c'è SDK da installare; alcune righe di codice HTTP standard sono tutto ciò di cui avete bisogno.

PDF.chat API

Introduzione

Autenticazione

Invia un documento

Ottieni un risultato

Scaricare un formato

Chat con un documento

Esempi di codice

Parametri

& Limiti errori

Domande frequenti

Come posso ottenere un gettone API?

Esiste una modalità sincrona (senza modulazioni)?

Quali lingue sono supportate?

Conservi i miei documenti?

Quali sono i limiti di aliquota e le quote?

Quali formati di input e output sono supportati?

Cosa significano i codici di errore?

Come ti sembra la risposta?

Quando devo usare tier=cpu vs tier=vlm?

Come funzionano lo strumento e i parametri translate_to?

Quanto grande posso inviare un file e come vengono gestiti i grandi lavori?

Ci sono SDK ufficiali?