Arabic - tesseract-ocr/tesstrain GitHub Wiki

استيراد المكتبات اللازمة

import pytesseract from PIL import Image import sys

تحديد مسار Tesseract إذا لزم الأمر (غالبًا غير ضروري بعد التثبيت)

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' # لـ Windows، قم بتعديله حسب نظامك

def extract_arabic_text(image_path): try: # فتح الصورة img = Image.open(image_path)

    # استخراج النص بالعربية (مع تحديد اللغة 'ara' للدعم الأمثل)
    text = pytesseract.image_to_string(img, lang='ara')
    
    # طباعة النص المستخرج (بالعربية فقط)
    print("النص المستخرج من الصورة:")
    print(text)
    
    # إذا أردت حفظ النص في ملف
    with open('extracted_text.txt', 'w', encoding='utf-8') as f:
        f.write(text)
    print("تم حفظ النص في ملف 'extracted_text.txt'")

except Exception as e:
    print(f"حدث خطأ: {str(e)}")

مثال على الاستخدام: استبدل 'image.jpg' بمسار صورة تحتوي على نص عربي

if name == "main": if len(sys.argv) < 2: print("يرجى تقديم مسار الصورة كوسيطة، مثال: python script.py image.jpg") else: extract_arabic_text(sys.argv[1])