PDF.chat API

Carregue um PDF e chat com ele a partir de seu próprio aplicativo — faça perguntas e receba respostas citadas para a página, em 100 mais idiomas. Medido por página, sem surpresas.

Visão geral

A API PDF.chat é uma pequena interface REST. Primeiro você POST um documento para ingerir e recuperar um trabalho com o texto do documento e uma desagregação por página (texto, caixas de ligação, confiança). POST perguntas contra esse trabalho e obter respostas fundamentadas no documento, cada uma citando a página de que veio. Empregos de 5 páginas ou menos retornar inline; trabalhos maiores retornam imediatamente com um pending status que você pesquisa até done.

  • URL base: https://pdf.chat
  • Documentos em: PDF, mais Word, PowerPoint, texto e imagens (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat fora: respostas com citações da página; transcrições através do endpoint da história
  • Texto processado fora: txt, md, docx, pdf, csv, json
  • Motores de leitura: cpu (documentos rápidos e impressos) e vlm (IA prémio, escrita, layout complexo, matemática)

Autenticação

Autenticar com o seu Token API (Encontrá-lo no seu página de contas) como cabeçalho de Beaser:

Authorization: Bearer YOUR_API_TOKEN

Você também pode passar ?api_token=… como parâmetro de consulta. O uso é medido em função do saldo de páginas da sua conta.

Enviar um documento

POST /api/v1/ocr/, Upload de formulário multipart.

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

Devolve o trabalho. Para arquivos ≤5 páginas ele já é done com o texto; arquivos maiores retornam pending/processing, estuda o endpoint de status.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

Obtém um resultado

GET /api/v1/ocr/<uuid>/, Enquete até status é done ou failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

Baixe um formato

GET /api/v1/ocr/<uuid>/download/?format=md, exportação do resultado. format é um txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat com um documento

Faça perguntas sobre um trabalho terminado. As respostas são fundamentadas apenas no texto extraído e cita a página de origem. Requer um token de conta, o recurso chat é conta-gartado.

POST /api/v1/chat/<uuid>/, Corpo JSON {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

Devolve a mensagem assistente com sua resposta e uma lista de páginas citadas:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, Obter a transcrição completa da conversa para um trabalho.

Exemplos de código

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

Parâmetros

CampoTipoDescrição
filefileRequerido. A imagem ou PDF para processar.
tierstringcpu (por omissão, rápido/impresso) ou vlm (IA prémio: escrita, layout, matemática).
languagestringauto (por omissão) ou um código linguístico (en, ch, ja, ar,...).
toolstringFerramenta opcional (por exemplo, summarize-pdf, ask-pdf) pre-estruturar os chat para essa tarefa.

Erros & limites

CódigoSignificado
400Sem arquivo, tipo não suportado ou arquivo demasiado grande.
401Token API faltante ou inválido.
402Fora de páginas, limite diário/mensal livre alcançado, ou nenhum crédito. O corpo inclui used/cap.
404Trabalho UUID não encontrado.
409Baixe solicitado antes de terminar o trabalho.

Cada página é processada os créditos de custos (1/página na linha rápida, mais sobre premium). Planos pagos elevar os caps por página de arquivo e adicionar prioridade. Ver Preço.

Perguntas mais frequentes

Criar uma conta gratuita e abrir o seu página de contas, o token é mostrado lá com um botão de cópia.

Sim, arquivos de 5 páginas ou menos retornam o resultado completo na resposta POST, por isso não é necessário levantar a maioria das imagens e PDFs curtos.

Mais de 100, incluindo scripts latino, CJK, árabe, cirílico e índico. Use language=auto detectar ou passar um código específico.

Os envios são processados apenas para responder às suas perguntas e apagados automaticamente. Nunca vendemos, compartilhamos ou treinamos em seus documentos.

O uso é medido por página em relação ao saldo da sua conta: chamadas anônimos recebem um subsídio diário por IP, contas gratuitas um balde mensal, e planos pagos usam créditos comprados com tampas de página mais altos por arquivo e prioridade. Quando você ficar fora você recebe um 402 com uso e tamp no corpo.

Você pode enviar PNG, JPG, WEBP, GIF, BMP, TIFF e PDF de várias páginas. Os resultados são baixados como txt, md, docx, pdf (investigável), csv ou json através do parâmetro do formato do endpoint de download.

400 é um arquivo faltante, tipo não suportado, ou arquivo demasiado grande; 401 um token faltante ou inválido; 402 fora das páginas; 404 um trabalho desconhecido UUID; e 409 um download solicitado antes de terminar a tarefa. Os corpos de erro incluem uma mensagem curta.

Um objeto de trabalho com status, nível, idioma, conta_pagina, e média_confiança, além do texto completo e marcação. A página quebra cada página em blocos com seu texto, caixa de delimitação (bbox) e confiança por bloco.

Use cpu (o padrão) para reconhecimento rápido e de baixo custo de documentos impressos limpos. Use vlm, o motor premium IA, para escrita, layouts complexos ou multi-columnas, matemática e tradução, onde é muito mais preciso.

Ferramenta de passe com um slug (por exemplo, resumo-pdf ou pergunta-pdf) para pre-frame o chat para essa tarefa, por isso o assistente é sintonizado para resumir ou responder perguntas sobre o documento.

Arquivos de 5 páginas ou menos retornam inline na resposta POST. Arquivos mais grandes voltam imediatamente como pendente ou processamento, e você pesquisa GET /api/v1/ocr /<uuid>/ até que o estado seja feito ou falhado. Planos pagos elevar o capuz de página por arquivo.

A API é um rest simples sobre HTTPS, por isso funciona de qualquer idioma com um cliente HTTP, consulte os exemplos de Python, Node.js e cURL acima. Não há nenhum SDK para instalar; algumas linhas de código HTTP padrão são tudo o que você precisa.