מערכת לעיבוד קבצי PDF והמרתם לטקסט באמצעות Gemini AI.
- עבור ל-Settings → Secrets and variables → Actions
- הוסף Secret חדש בשם
GEMINI_API_KEYעם מפתח ה-API שלך
- עבור ל-Actions → Process PDF with Gemini
- לחץ על "Run workflow"
- הזן:
- קישור ישיר לקובץ PDF - URL של הקובץ (חייב להיות נגיש)
- כמה עמודים בכל chunk - ברירת מחדל: 5
- לחץ "Run workflow"
לאחר שהעיבוד מסתיים:
- לחץ על ה-workflow run שהסתיים
- גלול למטה ל-Artifacts
- הורד את
processed-text
pip install google-genai PyPDF2 httpxcd test
python process_full_pdf.pyערוך את הקובץ כדי לשנות:
SOURCE_PDF- נתיב לקובץ PDFOUTPUT_TXT- נתיב לקובץ פלטPAGES_PER_CHUNK- כמה עמודים בכל chunkAPI_KEY- מפתח Gemini API
בדיקת חיתוך עמוד בודד עם k2pdfopt:
python test_k2pdfopt.py 2 # עמוד 2בדיקת Gemini על עמוד בודד:
python test_gemini.pyבדיקת Gemini על מספר עמודים:
python test_gemini_multi.py 5 # 5 עמודים- בקשות לדקה (RPM): 2
- טוקנים לדקה (TPM): 125,000
- בקשות ביום (RPD): 50
הסקריפט משתמש ב-2 threads במקביל כדי למקסם את השימוש במגבלת ה-RPM.
- ✅ עיבוד מקביל (2 chunks במקביל)
- ✅ שמירה אוטומטית של התקדמות
- ✅ תמיכה ב-SSL של NetFree
- ✅ זיהוי אוטומטי של טורים (ימין לשמאל)
- ✅ סינון כותרות עליונות והערות שוליים