PDF.chat API

ສົ່ງເອກະສານ PDF ແລະ chat ກັບມັນຈາກແອັບຂອງທ່ານເອງ - ຖາມຄໍາຖາມແລະໄດ້ຮັບຄໍາຕອບທີ່ກ່າວເຖິງໃນຫນ້າ, ໃນ 100 + ພາສາ. ວັດແທກຕໍ່ຫນ້າ, ບໍ່ແປກໃຈ.

ເບິ່ງ​ລວມ

PDF.chat API ແມ່ນ Interface REST ນ້ອຍ. ກ່ອນອື່ນ you POST ເອກະສານ​ທີ່​ຈະ​ກິນ​ມັນ​ເຂົ້າ​ໄປ ແລະ​ຮັບ​ວຽກ​ກັບ​ຄືນ​ມາ​ດ້ວຍ​ຂໍ້ຄວາມ​ຂອງ​ເອກະສານ ແລະ​ການ​ແບ່ງ​ອອກ​ຕາມ​ໜ້າ (ຂໍ້ຄວາມ, ​ກ່ອງ​ຈຳກັດ, ຄວາມ​ເຊື່ອ​ຖື) POST ຄໍາຖາມຕໍ່ກັບວຽກທີ່ແລະໄດ້ຮັບຄໍາຕອບທີ່ຕັ້ງຢູ່ໃນເອກະສານ, ແຕ່ລະຄົນອ້າງອີງເຖິງຫນ້າທີ່ມັນມາຈາກ. ວຽກຂອງ5ຫນ້າຫຼືຫນ້ອຍກັບຄືນ inline; ວຽກທີ່ໃຫຍ່ກວ່າກັບຄືນທັນທີກັບ pending ສະຖານະ​ທີ່​ທ່ານ​ປ່ອນ​ບັດ​ຈົນ​ກວ່າ done.

  • URL ພື້ນຖານ: https://pdf.chat
  • ເອກະສານ​ໃນ: PDF, ເພີ່ມຄໍາ, PowerPoint, ຂໍ້ຄວາມແລະຮູບພາບ (PNG, JPG, WEBP, GIF, BMP, TIFF)
  • Chat out: ຕອບ​ກັບ​ການ​ອ້າງ​ອີງ​ໜ້າ; ຖ່າຍ​ທອດ​ຜ່ານ​ຈຸດ​ຈົບ​ປະຫວັດ
  • ຂໍ້ຄວາມ​ທີ່​ໄດ້​ປະມວນຜົນ​ອອກ: txt, md, docx, pdf, csv, json
  • ເຄື່ອງຈັກ​ອ່ານ: cpu (ໄວ, ເອກະສານ​ພິມ) ແລະ vlm (AI ລະດັບສູງ, ການຂຽນດ້ວຍມື, ແຜນທີ່ສັບສົນ, ຄະນິດສາດ)

ການ​ផ្ទៀង​ផ្ទាត់​ຄວາມ​ຖືກຕ້ອງ

ກວດສອບ​ຄວາມ​ຖືກຕ້ອງ​ດ້ວຍ​ຕົວ​ທ່ານ​ເອງ ຕົວ​ແທນ API (ຊອກຫາມັນຢູ່ໃນຂອງທ່ານ ទំព័រ​ບັນຊີ) ເປັນ​ຫົວ​ຂໍ້​ຂອງ​ຜູ້​ຖື:

Authorization: Bearer YOUR_API_TOKEN

ທ່ານສາມາດ​ສົ່ງ​ຜ່ານ​ໄດ້ ?api_token=… ຕົວ​ເລືອກ​ນີ້​ຈະ​ໃຊ້​ເປັນ​ປາຣາມ​ເຕີ​ການ​ສອບ​ຖາມ​ທີ່​ໃຊ້​ງານ​ໄດ້​ໂດຍ​ອີງ​ໃສ່​ການ​ສົມດຸນ​ຂອງ​ໜ້າ​ຂອງ​ບັນຊີ​ຂອງທ່ານ.

ສົ່ງ​ເອກະສານ

POST /api/v1/ocr/, ສົ່ງ​ແບບຟອມ​ຫຼາຍ​ສ່ວນ​ຂຶ້ນ​ໄປ

curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@invoice.pdf" \
  -F "tier=vlm" \
  -F "language=auto"

ສົ່ງ​ຄືນ​ວຽກ​ຄືນ​ມາ ។ ສຳ​ລັບ​ເອກະສານ​ທີ່​ມີ​ໜ້າ ≤5ມັນ​ມີ​ແລ້ວ done ນໍາ​ຂໍ້ຄວາມ; ໄຟລ໌​ທີ່​ໃຫຍ່​ກວ່າ​ຈະ​ກັບ​ມາ pending/processing, ຖາມ​ສະຖານະ​ຈຸດ​ຈົບ.

{
  "uuid": "9f2c1b7e4a...",
  "status": "done",
  "tier": "vlm",
  "language": "auto",
  "page_count": 1,
  "mean_confidence": 0.98,
  "text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
  "markdown": "# INVOICE\n\n**Acme Corp** ...",
  "pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}

ຮັບ​ຜົນ​ໄດ້

GET /api/v1/ocr/<uuid>/, ຖາມຈົນກວ່າ status ແມ່ນ done ​ឬ failed.

curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN"

ດາວໂຫລດ​ຮູບແບບ

GET /api/v1/ocr/<uuid>/download/?format=md, ສົ່ງອອກ​ຜົນ​ການ​ຄົ້ນຫາ format ແມ່ນ​ໜຶ່ງ​ໃນ txt, md, docx, pdf, csv, json.

curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
  -H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx

Chat with a document

ຖາມ​ຄໍາຖາມ​ກ່ຽວກັບ​ວຽກ​ທີ່​ໄດ້​ເຮັດ​ແລ້ວ. ຄໍາຕອບ​ແມ່ນ​ອີງ​ໃສ່​ຂໍ້ຄວາມ​ທີ່​ໄດ້​ຖອດ​ອອກ​ມາ ແລະ ຖອດ​ບົດ​ຄວາມ​ທີ່​ມາ​ຈາກ​ຫນ້າ​ແຫຼ່ງ. ຕ້ອງການ​ບັນຊີ​ໂຕກັ່ນ, ຄຸນ​ສົມບັດ chat ແມ່ນ​ບັນຊີ​ທີ່​ມີ​ການ​ເຂົ້າ​ເຖິງ​ໄດ້.

POST /api/v1/chat/<uuid>/, ທ້ອງ JSON {"message": "your question"}.

curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the invoice total and due date?"}'

ສົ່ງຄືນ​ຂໍ້ຄວາມ​ຂອງ​ຜູ້ຊ່ວຍ​ພ້ອມ​ດ້ວຍ​ຄຳ​ຕອບ ແລະ ລາຍ​ຊື່​ຂອງ​ໜ້າ​ທີ່​ອ້າງອີງ:

{"conversation": "a1b2…", "message": {
   "role": "assistant",
   "content": "The total is $42, due on March 3 (p. 1).",
   "citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}

GET /api/v1/chat/<uuid>/history/, ເອົາ​ການ​ສົນທະນາ​ເຕັມ​ມາ​ໃຊ້​ໃນ​ວຽກ​ໜຶ່ງ

ຕົວຢ່າງ​ຂອງ​កូដ

import requests, time

BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}

# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
    job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()

# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
    time.sleep(2)
    job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()

# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
    json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";

const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };

// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();

// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
  await new Promise(r => setTimeout(r, 2000));
  job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}

// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
  method: "POST", headers: { ...H, "Content-Type": "application/json" },
  body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -F "file=@contract.pdf"

# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"message": "What is the termination notice period?"}'

​ប៉ារ៉ាម៉ែត្រ

​ແຄມ​ເປນປະເພດຄໍາ​ອະທິບາຍ
filefileຕ້ອງການ ຮູບ ຫຼື PDF ທີ່​ຈະ​ປະມວນຜົນ
tierstringcpu (ປັ໊ກ​ເດີມ, ໄວ/ພິມ) ຫຼື vlm (AI ພິເສດ: ການຂຽນດ້ວຍມື, ແຜນທີ່, ຄະນິດສາດ).
languagestringauto (ປັ​ນ​ເດີມ) ຫຼື ລະຫັດ​ພາສາ (en, ch, ja, ar,...
toolstringເຄື່ອງມື​ທີ່​ເລືອກ​ໄດ້ (e. g. summarize-pdf, ask-pdf) ເພື່ອກ່ອນ-frame chat ສໍາລັບວຽກນັ້ນ.

ຂໍ້ຜິດພາດ & ຈໍາກັດ

ລະຫັດຕົວ​ອັກສອນ​ທີ່​ໃຊ້​ໄດ້
400ບໍ່ມີ​ໄຟລ໌, ປະເພດ​ທີ່​ບໍ່​ໄດ້​ຮອງຮັບ ຫຼື ໄຟລ໌​ໃຫຍ່ເກີນໄປ.
401ສູນເສຍ ຫຼື ບໍ່ມີ API token ຖືກຕ້ອງ.
402ອອກ​ຈາກ​ໜ້າ, ​ໄດ້​ເຖິງ​ຂີດ​ຈຳກັດ​ຟຣີ​ຕໍ່​ມື້/​ເດືອນ ຫຼື ບໍ່ມີ​ຄະແນນ. ເນື້ອໃນ​ລວມ​ມີ used/cap.
404ບໍ່​ພົບ UUID ຂອງ​ວຽກ ។
409ຂໍ​ດາວໂຫລດ​ກ່ອນ​ທີ່​ວຽກ​ຈະ​ສຳເລັດ

ຫນ້າແຕ່ລະຫນ້າທີ່ປະມວນຜົນຄ່າໃຊ້ຈ່າຍຂອງສິນເຊື່ອ (1 / ຫນ້າໃນລະດັບໄວ, ຫຼາຍກ່ຽວກັບຄ່າທໍານຽມ). ແຜນທີ່ຈ່າຍຍົກຂຶ້ນມາໃນແຕ່ລະເອກະສານຫນ້າແລະເພີ່ມຄວາມສໍາຄັນ. ລາຄາ.

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

ສ້າງບັນຊີຟຣີ ແລະ ເປີດບັນຊີຂອງທ່ານ ទំព័រ​ບັນຊີ, ຕົວ​ແທນ​ຂອງທ່ານ​ຈະ​ຖືກ​ສະແດງ​ຢູ່​ທີ່​ນັ້ນ​ດ້ວຍ​ປຸ່ມ​ຄັດ​ລອກ.

ຍອມຮັບ, ໄຟລ໌ທີ່ມີ5ໜ້າ ຫຼື ໜ້ອຍກວ່າ ຈະສົ່ງຜົນໄດ້ຮັບເຕັມໃນຄໍາຕອບ POST, ສະນັ້ນບໍ່ຈໍາເປັນຕ້ອງປ່ອນບັດສໍາລັບຮູບພາບສ່ວນຫຼາຍແລະ PDFs ຫຍໍ້.

ຫຼາຍກວ່າ 100, ລວມທັງ​ສະຄຣິບ​ລາຕິນ, CJK, ອາຣັບ, ຊີຣີລ໌ ແລະ ອິນເດຍ. ໃຊ້ language=auto ເພື່ອ​ກວດ​ພົບ ຫຼື ສົ່ງ​ລະຫັດ​ສະເພາະ

ການອັບໂຫລດແມ່ນຖືກປະຕິບັດພຽງແຕ່ເພື່ອຕອບຄໍາຖາມຂອງທ່ານແລະຖືກລຶບອອກໂດຍອັດຕະໂນມັດ. ພວກເຮົາບໍ່ເຄີຍຂາຍ, ແບ່ງປັນຫຼືຝຶກອົບຮົມກ່ຽວກັບເອກະສານຂອງທ່ານ.

ການໃຊ້ງານແມ່ນຖືກວັດແທກຕໍ່ ໜ້າ ຕໍ່ກັບສະຖິຕິບັນຊີຂອງທ່ານ: ການໂທທີ່ບໍ່ຮູ້ຊື່ໄດ້ຮັບເງິນອຸດ ໜູນ ຕໍ່ IP ຕໍ່ມື້, ບັນຊີຟຣີແມ່ນບັອກເດືອນແລະແຜນທີ່ຈ່າຍໃຊ້ເງິນກູ້ທີ່ຊື້ມາພ້ອມກັບ ໜ້າ ຈໍແລະຄວາມສໍາຄັນຂອງ ໜ້າ ຈໍທີ່ສູງກວ່າ. ເມື່ອທ່ານແລ່ນອອກໄປທ່ານຈະໄດ້ຮັບ 402 ທີ່ມີໃຊ້ແລະກອບໃນຮ່າງກາຍ.

ທ່ານສາມາດສົ່ງ PNG, JPG, WEBP, GIF, BMP, TIFF, ແລະ PDF ຫຼາຍ ໜ້າ. ຜົນໄດ້ຮັບດາວໂຫລດເປັນ txt, md, docx, pdf (ສາມາດຄົ້ນຫາໄດ້), csv, ຫຼື json ຜ່ານການດາວໂຫລດປາຣເມັດຮູບແບບຈຸດສຸດທ້າຍ.

400 ແມ່ນ​ເອກະສານ​ທີ່​ຂາດ, ປະເພດ​ທີ່​ບໍ່​ໄດ້​ຮັບ​ການ​ສະໜັບສະໜູນ ຫຼື ເອກະສານ​ທີ່​ໃຫຍ່​ເກີນ​ໄປ; 401 ແມ່ນ​ເອກະສານ​ທີ່​ຂາດ ຫຼື ບໍ່ມີ​ຕົວ​ແທນ​ທີ່​ຖືກຕ້ອງ; 402 ອອກ​ຈາກ​ໜ້າ; 404 ແມ່ນ​ວຽກ UUID ທີ່​ບໍ່​ຮູ້; ແລະ 409 ແມ່ນ​ການ​ດາວໂຫລດ​ທີ່​ໄດ້​ຮ້ອງຂໍ​ກ່ອນ​ທີ່​ວຽກ​ຈະ​ສຳເລັດ. ເນື້ອໃນ​ຂອງ​ຂໍ້ຜິດພາດ​ລວມ​ມີ​ຂໍ້ຄວາມ​ສັ້ນໆ.

ສິ່ງ​ຂອງ​ວຽກ​ທີ່ມີ​ສະຖານະ, ລະດັບ, ພາສາ, page_ count, ແລະ mean_ confidence, ລວມ​ທັງ​ຂໍ້ຄວາມ​ເຕັມ ແລະ markdown. ລາຍການ​ໜ້າ​ແບ່ງ​ໜ້າ​ແຕ່ລະ​ໜ້າ​ອອກ​ເປັນ​ບລັອກ​ດ້ວຍ​ຂໍ້ຄວາມ, ຕົວ​ກຳນົດ​ຂອບເຂດ (bbox), ແລະ ​ຄວາມ​ເຊື່ອ​ຖື​ຕໍ່​ບລັອກ.

ໃຊ້ cpu (ປັ໊ມ​ເດີມ) ເພື່ອ​ຮັບຮູ້​ເອກະສານ​ທີ່​ພິມ​ອອກ​ຢ່າງ​ໄວ ແລະ ລາຄາ​ຖືກ. ໃຊ້ vlm, ເຄື່ອງຈັກ AI ທີ່ມີ​ລາຄາ​ຖືກ, ສຳ​ລັບ​ການ​ຂຽນ​ດ້ວຍ​ມື, ການຈັດ​ວາງ​ທີ່​ສັບສົນ ຫຼື ຫຼາຍ​ແຖວ, ຄະນິດສາດ ແລະ ການ​ແປ, ບ່ອນ​ທີ່​ມັນ​ຈະ​ຖືກຕ້ອງ​ຫຼາຍ​ກວ່າ.

ສົ່ງ​ເຄື່ອງມື​ດ້ວຍ​ສະລອຍ (ຕົວຢ່າງ summarize- pdf ຫຼື ask- pdf) ເພື່ອ​ກອບ​ກ່ອນ​ທີ່ chat ສຳ​ລັບ​ວຽກ​ນັ້ນ, ສະນັ້ນ​ຜູ້ຊ່ວຍ​ແມ່ນ​ໄດ້​ຮັບ​ການ​ປັບ​ປຸງ​ເພື່ອ​ສັງລວມ ຫຼື ຕອບ​ຄຳ​ຖາມ​ກ່ຽວກັບ​ເອກະສານ.

ໄຟລ໌ຂອງ5ຫນ້າຫຼື ໜ້ອຍ ກວ່າກັບຄືນໃນຄໍາຕອບ POST. ໄຟລ໌ໃຫຍ່ກວ່າມາກັບຄືນທັນທີເປັນ pendent ຫຼື ຂະບວນການ, ແລະທ່ານ poll GET /api/v1/ocr /<uuid>/ ຈົນກວ່າ​ສະຖານະ​ຈະ​ສຳເລັດ ຫຼື ລົ້ມເຫລວ. ແຜນທີ່​ຈ່າຍ​ເພີ່ມ​ການ​ກີດ​ກັນ​ຂອງ​ໜ້າ​ຕໍ່​ໄຟລ໌.

API ແມ່ນ REST ປົກກະຕິຜ່ານ HTTPS, ສະນັ້ນມັນເຮັດວຽກຈາກພາສາໃດກໍ່ຕາມທີ່ມີລູກຄ້າ HTTP, ເບິ່ງຕົວຢ່າງ Python, Node.js ແລະ cURL ຂ້າງເທິງ. ບໍ່ມີ SDK ທີ່ຈະຕິດຕັ້ງ; ບາງລໍາດັບຂອງລະຫັດ HTTP ມາດຕະຖານແມ່ນທຸກຢ່າງທີ່ທ່ານຕ້ອງການ.