Arabic - tesseract-ocr/tesstrain GitHub Wiki
استيراد المكتبات اللازمة
import pytesseract from PIL import Image import sys
تحديد مسار Tesseract إذا لزم الأمر (غالبًا غير ضروري بعد التثبيت)
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' # لـ Windows، قم بتعديله حسب نظامك
def extract_arabic_text(image_path): try: # فتح الصورة img = Image.open(image_path)
# استخراج النص بالعربية (مع تحديد اللغة 'ara' للدعم الأمثل)
text = pytesseract.image_to_string(img, lang='ara')
# طباعة النص المستخرج (بالعربية فقط)
print("النص المستخرج من الصورة:")
print(text)
# إذا أردت حفظ النص في ملف
with open('extracted_text.txt', 'w', encoding='utf-8') as f:
f.write(text)
print("تم حفظ النص في ملف 'extracted_text.txt'")
except Exception as e:
print(f"حدث خطأ: {str(e)}")
مثال على الاستخدام: استبدل 'image.jpg' بمسار صورة تحتوي على نص عربي
if name == "main": if len(sys.argv) < 2: print("يرجى تقديم مسار الصورة كوسيطة، مثال: python script.py image.jpg") else: extract_arabic_text(sys.argv[1])