PDF.chat ಎಪಿ
PDF ಮತ್ತು chat ಎಂಬ ಒಂದು ಪ್ರೊಗ್ರಾಮ್ ಅನ್ನು ನಿಮ್ಮ ಸ್ವಂತ Appದಿಂದ ಉತ್ಥಾಪಿಸಿ. 100+ ಭಾಷೆಗಳಲ್ಲಿ, ಪುಟಕ್ಕೆ ಉಲ್ಲೇಖಿಸಲಾದ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿ. ಯಾವುದೇ ಆಶ್ಚರ್ಯವಿಲ್ಲ.
ವಿಲೋಮ
PDF.chat API ಒಂದು ಸಣ್ಣ Reevelp ಸಂಪರ್ಕಸಾಧನ. ನೀವು ಮೊದಲಿಗೆ. POST ಅದನ್ನು ಆನ್ಲೈನ್ ಮಾಡಲು ಒಂದು ದಸ್ತಾವೇಜು ಹಾಗು ದಸ್ತಾವೇಜಿನ ಪಠ್ಯ ಮತ್ತು ಒಂದು ಪುಟದ ಕುಸಿತ ( ಪಠ್ಯ, ಪುಟದ ಚೌಕ, ನಿಶ್ಯಬ್ಧ). ನೀವು ಅದನ್ನು ಬಳಸಲು ಬಯಸುತ್ತೀರಾದಾಗ, ಇದನ್ನು ಮರಳಿ ಪಡೆಯಲು ಬಯಸುತ್ತೀರಾ? POST 5 ಪುಟಗಳ ಅಥವಾ ಅದಕ್ಕಿಂತಲೂ ಕಡಿಮೆ ಪುಟದ ಕೆಲಸಗಳು ಇಂಗಾಲಕ್ಕೆ ಬಂದು ಸೇರುತ್ತವೆ; ದೊಡ್ಡ ಕೆಲಸಗಳು ತಕ್ಷಣ ಒಂದು ಕೆಲಸಕ್ಕೆ ಹಿಂದಿರುಗುತ್ತವೆ pending ನೀವು ಸಲ್ಲಿಸಿದ ಸ್ಥಿತಿಗತಿ@ label done.
- ಮೂಲ URL:
https://pdf.chat - ಇದರಲ್ಲಿನ ದಸ್ತಾವೇಜುಗಳು: PDF, ಹಾಗು ಪದ, ಪವರ್ ಪೋಂಟಂಟ್, ಪಠ್ಯ, ಹಾಗು ಚಿತ್ರಗಳು (PPG, WEG, TIMS, ಫೈನ್ ಲ್ಯಾಪ್ ಲ್ಯಾಪ್)
- Chat வெளியே: ಪುಟದ ಸಂಪಾದನೆಗಳೊಂದಿಗೆ; ಇತಿಹಾಸದ ಕೊನೆಯ ಹಂತದ ಮೂಲಕ ತೆಗೆಯಲಾಗುವ ರೆಜಿಸ್ಟರ್ಡ್ಗಳು
- ಸಂಸ್ಕರಿಸಲಾದ ಪಠ್ಯ:
txt,md,docx,pdf,csv,json - ತಂತ್ರಾಂಶಗಳನ್ನು ಓದಲಾಗುತ್ತಿದೆ:
cpu(ವೇಗ, ಮುದ್ರಿಕೆ ಡೋಕ್ಸ್)vlm(ಪೇತ್ರಿಮಿಮಿಯಾಮಿಮ್ AI, ಹಸ್ತಮೈಥುನ, ಜಟಿಲ ವಿನ್ಯಾಸ, ಗಣಿತ)
ದೃಢೀಕರಣ
ನಿಮ್ಮೊಂದಿಗೆ ವಿಶ್ವಾಸಾರ್ಹ API ಗುರುತು ( ನಿಮ್ಮ ಮೇಲೆ ಚಿತ್ರ ನೋಡಿ.) ಖಾತೆ ಪುಟ(ವರ್ತಕ ಶಿರೋನಾಮದೋಪಾದಿ):
Authorization: Bearer YOUR_API_TOKEN
ದಾಟಿಹೋಗಬಹುದು ?api_token=… ಮನವಿ ವ್ಯಾಪ್ತಿಯಂತೆ. ನಿಮ್ಮ ಖಾತೆಯ ಪುಟದ ಮಿತಿಗೆ ವಿರುದ್ಧವಾದ ಬಳಕೆ ಗೆರೆ ಹಾಕಲಾಗುತ್ತದೆ.
ದಸ್ತಾವೇಜನ್ನು ಪ್ರತಿಮಾಡಿ
POST /api/v1/ocr/, ಬಹುಭಾಗದ (application) ರೂಪಾಂತರ (load) ವುದೆ (load).
curl -X POST https://pdf.chat/api/v1/ocr/ \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-F "file=@invoice.pdf" \
-F "tier=vlm" \
-F "language=auto"
ಕೆಲಸವನ್ನು ಮರಳಿಸುತ್ತದೆ. ಇದು ಈಗಾಗಲೆ ಇರುವ 0. 85- ಪುಟದ ಕಡತಗಳು done ಪಠ್ಯದೊಂದಿಗೆ; ದೊಡ್ಡ ಕಡತಗಳು ಹಿಂದಿರುಗುತ್ತವೆ pending/processing, ಸ್ಥಿತಿಗತಿ ಕೈಪಿಡಿ ಮಾಡಿ.
{
"uuid": "9f2c1b7e4a...",
"status": "done",
"tier": "vlm",
"language": "auto",
"page_count": 1,
"mean_confidence": 0.98,
"text": "INVOICE\nAcme Corp\nTotal: 215.00 USD",
"markdown": "# INVOICE\n\n**Acme Corp** ...",
"pages": [ { "index": 0, "text": "...", "blocks": [ { "text": "...", "bbox": [x0,y0,x1,y1], "confidence": 0.98 } ] } ]
}
ಫಲಿತಾಂಶವನ್ನು ಪಡೆದುಕೊಳ್ಳಿ
GET /api/v1/ocr/<uuid>/, ಪ್ರೊಗ್ರಾಮ್ ಮಾಡಲ್ಪಡುವ ತನಕ ಪರಿಶೀಲಿಸು@ label status ಈ done ಪಟ್ಟಿ failed.
curl https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../ \
-H "Authorization: Bearer YOUR_API_TOKEN"
ಒಂದು ವಿನ್ಯಾಸವನ್ನು ನಕಲಿಳಿಸಿ
GET /api/v1/ocr/<uuid>/download/?format=md, ಫಲಿತಾಂಶವನ್ನು ರಫ್ತು ಮಾಡಿ. format ಇದು ಒಂದು txt, md, docx, pdf, csv, json.
curl -L "https://pdf.chat/api/v1/ocr/9f2c1b7e4a.../download/?format=docx" \
-H "Authorization: Bearer YOUR_API_TOKEN" -o result.docx
Chat ದಸ್ತಾವೇಜನ್ನು ಹೊಂದಿರುವ Chat
ಒಂದು ಪೂರ್ಣಗೊಂಡ ಕೆಲಸದ ಬಗ್ಗೆ ಪ್ರಶ್ನೆಗಳನ್ನಿಡಿರಿ. ಚಾಲಯಿಸಲಾದ ಪಠ್ಯದಲ್ಲಿ ಮಾತ್ರ ಉತ್ತರಗಳನ್ನು ಅನ್ವೇಷಿಸಲಾಗಿದೆ ಹಾಗು ಮೂಲದ ಪುಟವನ್ನು ಉಲ್ಲೇಖಿಸುತ್ತದೆ. ಒಂದು ಖಾತೆಯ ಅಗತ್ಯವಿರುತ್ತದೆ chat ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಖಾತೆಗೆ ಸೇರಿಸಲಾಗುವುದು.
POST /api/v1/chat/<uuid>/, ಜಾಸನ್ ದೇಹ {"message": "your question"}.
curl -X POST https://pdf.chat/api/v1/chat/9f2c1b7e4a.../ \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{"message": "What is the invoice total and due date?"}'
ಸಹಾಯಕ ಸಂದೇಶವನ್ನೂ ಅದರ ಉತ್ತರವನ್ನೂ ಉಲ್ಲೇಖಿಸಿದ ಪುಟಗಳ ಒಂದು ಪಟ್ಟಿಯನ್ನು ಮರಳಿಸುತ್ತದೆ:
{"conversation": "a1b2…", "message": {
"role": "assistant",
"content": "The total is $42, due on March 3 (p. 1).",
"citations": [{"page": 1, "cited_text": "The invoice total is $42…", "document_id": "9f2c1b7e4a…"}]
}}
GET /api/v1/chat/<uuid>/history/, ಉದ್ಯೋಗಕ್ಕಾಗಿ ಪೂರ್ಣ ಸಂಭಾಷಣೆಯನ್ನು ಮಾಡಿ.
ಸಂಕೇತ ಉದಾಹರಣೆಗಳು
import requests, time
BASE = "https://pdf.chat/api/v1"
H = {"Authorization": "Bearer YOUR_API_TOKEN"}
# 1. Upload a PDF
with open("contract.pdf", "rb") as f:
job = requests.post(BASE + "/ocr/", headers=H, files={"file": f}).json()
# 2. Wait until it's ready to chat
while job["status"] in ("pending", "processing"):
time.sleep(2)
job = requests.get(f"{BASE}/ocr/{job['uuid']}/", headers=H).json()
# 3. Ask questions — every answer is cited to the page
ans = requests.post(f"{BASE}/chat/{job['uuid']}/", headers=H,
json={"message": "What is the termination notice period?"}).json()
print(ans["message"]["content"])
print(ans["message"]["citations"])
import fs from "fs";
const BASE = "https://pdf.chat/api/v1";
const H = { Authorization: "Bearer YOUR_API_TOKEN" };
// 1. Upload a PDF
const form = new FormData();
form.append("file", new Blob([fs.readFileSync("contract.pdf")]), "contract.pdf");
let job = await (await fetch(`${BASE}/ocr/`, { method: "POST", headers: H, body: form })).json();
// 2. Wait until it's ready to chat
while (["pending", "processing"].includes(job.status)) {
await new Promise(r => setTimeout(r, 2000));
job = await (await fetch(`${BASE}/ocr/${job.uuid}/`, { headers: H })).json();
}
// 3. Ask questions — every answer is cited to the page
const ans = await (await fetch(`${BASE}/chat/${job.uuid}/`, {
method: "POST", headers: { ...H, "Content-Type": "application/json" },
body: JSON.stringify({ message: "What is the termination notice period?" })
})).json();
console.log(ans.message.content, ans.message.citations);
# 1. Upload a PDF
curl -X POST https://pdf.chat/api/v1/ocr/ \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-F "file=@contract.pdf"
# 2. Ask questions (use the uuid from step 1) — answers cited to the page
curl -X POST https://pdf.chat/api/v1/chat/UUID/ \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{"message": "What is the termination notice period?"}'
ಪ್ರಮಿತಿಗಳು
| ಕ್ಷೇತ್ರ | ಬಗೆ | ವಿವರಣೆ |
|---|---|---|
file | file | ಅಗತ್ಯ. ಕಾರ್ಯಗತಗೊಳಿಸಬೇಕಿರುವ ಪ್ರತಿರೂಪ ಅಥವ PDF. |
tier | string | cpu (ಪೂರ್ವನಿಯೋಜಿತ, ವೇಗ/ ಮುದ್ರಿತ) vlm (ಹಿಂದಿನ ಪ್ರಮಾಣ AI: ಕೈಬರಹ, ವಿನ್ಯಾಸ, ಗಣಿತ. |
language | string | auto (ಪೂರ್ವನಿಯೋಜಿತ) ಅಥವಾ ಭಾಷೆಯ ಸಂಕೇತ (ಪೂರ್ವನಿಯೋಜಿತ)en, ch, ja, ar. |
tool | string | ಐಚ್ಛಿಕ ಉಪಕರಣ ನಿರೂಪಣಾ (ಉದಾ. ದಾ. summarize-pdf, ask-pdf(ಆ ಕೆಲಸಕ್ಕಾಗಿ ಮುಂಬದಿ chat. |
ದೋಷಗಳು ಮತ್ತು ಮಿತಿಗಳು
| ಕೋಡ್ | ಅರ್ಥ |
|---|---|
400 | ಯಾವುದೆ ಕಡತ, ಬೆಂಬಲವಿಲ್ಲದ ಬಗೆ, ಅಥವ ಕಡತವು ಬಹಳ ದೊಡ್ಡದಾಗಿದೆ. |
401 | API ಸಂಕೇತವು ಕಾಣಿಸುತ್ತಿಲ್ಲ ಅಥವ ಅಮಾನ್ಯವಾಗಿದೆ. |
402 | ಪುಟಗಳಿಂದ, ತಿಂಗಳಿಗೆ / ತಿಂಗಳಿಗೆ ಉಚಿತ ಮಿತಿಗಳು ತಲುಪುತ್ತವೆ ಅಥವಾ ಸಾಲಗಳಿಲ್ಲ. used/cap. |
404 | ಉದ್ಯೋಗದ UID ಸಿಗಲಿಲ್ಲ. |
409 | ಕೆಲಸ ಮುಗಿಯುವ ಮೊದಲು దింపಿದ್ದನ್ನು ಕೋರಲಾಗಿದೆ. @ info: status |
ಪ್ರತಿಯೊಂದು ಪುಟದಲ್ಲಿ ಸಂಸ್ಕರಿಸಲಾದ ದರ ದರಗಳು (೧/ ಪುಟ), ಉತ್ಪಾದನೆ (ಟ್ರೇಟರ್), ಉತ್ಪಾದನೆ (ಟ್ರೇಟರ್), ಹೆಚ್ಚಿನ ಹಾರ್ಡ್ ಬೋರ್ಡರ್ನ ಮೇಲೆ (೧/ ಪುಟ), ಪ್ಲಾಸ್ನ ಬಗೆಗಿನ ಬೆಲೆ. ಪೈಡ್ ಪ್ಲಾಸ್ ಪ್ರತಿ ಪುಟದ ಕಪ್ಸ್ಗಳನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ ಹಾಗು ಆದ್ಯತೆಯನ್ನು ಸೇರಿಸುತ್ತದೆ. ಸಂಸ್ಕರಿಸಲಾಗುತ್ತಿದೆ.
ಆಗಾಗ್ಗೆ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಲಾಗುತ್ತದೆ
language=auto ಅದನ್ನು ಗುರುತಿಸಲು ಅಥವಾ ನಿರ್ದಿಷ್ಟ ಸಂಕೇತೀಕರಣವನ್ನು ದಾಟಲು.