הכתב הערבי יש לו אותה בעיה של דו-כיווניות (אותיות מימין לשמאל, מספרים משמאל לימין) כמו בעברית, ותכונה נוספת שאין בעברית: חיבור האותיות, אשר גורם להשתנות צורתן בהתאם לסביבתן. למשל האות הערבית "עין" תיכתב כך בצורתה הבסיסית:
ع
אך זוהי הצורה הסופית הבודדת בלבד, הנכתבת בסוף המילה כשאין אות מתחברת משמאלה. לאות "עין" בערבית ארבע צורות שונות בהתאם לסביבתה:
عنب "עִנַבּ" - ענבים
معلم "מֻעַלִּם" - מורֶה
الجميع - "אַלְגַ'מִיע" - הכל
شارع - "שַארִע" - רחוב
כותבי עברית עוד יכולים לשים חמש צורות סופיות על המקלדת ולהקליד אותם בבוא הצורך, אבל הצורות המרובות של כל אות ערבית אין להן מקום מספיק, ובחירת הצורה הנכונה לכל מילה היא טורח מיותר וגוזל זמן. עדיף לתת למחשב לעשות את עבודת חיבור האותיות, כפי שאתם רואים כאן בדפדפן (בגרסת היוניקוד תחת Internet Explorer). מכאן שמנגנון תצוגה לעברית צריך לתמוך לא רק בכיווניות משתמעת כמו בעברית, אלא גם בניתוח ההקשר (context analysis) כדי לשוות את הצורה הנכונה לאותיות. האותיות הערביות מאוחסנות על המחשב כך:
ع
ر
ب
ي
ותחילה הן מוצגות מימין לשמאל על-ידי מנגנון תצוגת הדו-כיווניות:
ع ر ب ي
ואז פועל עליהן מנגנון חיבור האותיות:
عربي
בשל הקושי הרב ליישם ערבית מחוברת בשיטה החזותית (הערבית בשימושים הראשונים שלה במחשבים הייתה חזותית ללא חיבור אותיות) הומצא האחסון המשתמע לערבית בשלב מוקדם למדי, לפני העברית. האחסון המשתמע בעברית לקוח מהשיטה שבה משתמשים לערבית. ערבית של DOS הייתה משתמעת מלכתחילה, והכילה גם ניקוד. למעשה, יישום מנגנון התצוגה הוא עבודה לא קלה, אך מצד שני, הערבים לא השתמשו בתחבולות ואלתורים כמו בעברית, כך ששיטת האחסון אינה מהווה בעיה בטקסטים בערבית. טקסט בערבית שנוצר ב-DOS יאוחסן באותה שיטה כמו ב-Windows, ויש רק להמיר את הקידוד. ואכן הקידוד, שדווקא בעברית אחיד למדי ואינו גורם בעיות מרובות, הוא מקור לכאבי ראש בעבודה בערבית במחשבים.
הבעיות בקידוד הערבית נובעים בעיקר מההתנגשות בין ההחלטות של ארגון התקנים הערבי (ASMO, שעובד יחד עם ארגון ISO) לבין יצרניות החומרה והתוכנה, שהיו להן שיקולים אחרים. יש ארבעה דפי קוד שונים לערבית - שניים ב-DOS ושניים במערכות המתקדמות יותר. בערבית של DOS היה תחילה הקוד של יבמ, מספר 864, שהקצה מקומות לאותיות צרפתיות (תנועות לטיניות עם אקצנטים) למען ערבים דוברי צרפתית. ארגון ASMO חיבר את דף הקוד 720 לערבית של DOS. מערכות Windows ערביות מכילות אפשרות עבודה עם שני הקידודים והמרה ביניהם. מערכת Windows 2000 משתמשת בדף הקוד 720 לערבית של DOS, אך כמו בעברית אין כמעט אפשרות להציג ערבית של DOS על המסך (חוץ מאשר דרך Internet Explorer).
במערכות יותר מתקדמות (Windows, מקינטוש ו-Unix) נוצרו שוב שני קידודים שאין תאימות ביניהם: הערבית של ISO, המכילה ערבית בלבד במיקום רצוף על מפת התווים, והערבית של Windows, שמיקרוסופט השחילה בה אותיות ערביות נוספות לפרסית ולאורדו, ואותיות צרפתיות, מאותו שיקול כמו ב-DOS קודם לכן. הערבית של ISO היא אמנם התקן הרשמי, ועליו ממליצים בבניית אתרי אינטרנט בערבית, אך למעשה גדול יותר מספר משתמשי הגרסאות הערביות של Windows, והרוב הגדול של אתרי אינטרנט ערבים המציגים ערבית כטקסט (תכף אסביר על כך) מקודדים בערבית של Windows, בדף הקוד 1256. במערכת Windows ערבית אפשר לצפות בטקסט ערבי של ISO באמצעות Internet Explorer ולהמיר אותו לערבית של Windows. אני מקווה שהמעבר ליוניקוד יכניס סדר בקידוד הערבית וישים קץ לצורך להמיר בין קידודים. נכון לעכשיו רוב הערבית מקודדת בקוד של Windows, משום שנוצרה במערכת של מיקרוסופט, אך מחשבי מקינטוש ו-Unix משתמשים בקידוד ISO.
בקשר לעברית באינטרנט אנו יודעים שעברית חזותית (אם הוכנה כשורה, תרתי משמע) תיראה בכל הדפדפנים. מה עושים כדי שתיראה ערבית בכל הדפדפנים? תמונות, לא פחות ולא יותר. הדרך היחידה לוודא שהערבית תיראה בדפדפן כמו Netscape היא להכין גרסת תמונות GIF של האתר. זוהי שיטה גרועה יותר מהעברית החזותית, מכיוון שאי-אפשר לעשות שום דבר עם הטקסט בצורה כזו (חוץ מאשר על-ידי סריקה ב-OCR, אשר ממיר את התווים לטקסט, אך זהו פתרון יקר, שלא כמו הורדה פשוטה של תוכנה להפיכת העברית). אי-אפשר לחפש או להעתיק, ואפילו תמונות ה-GIF הקטנות ביותר תופסות יותר מקום מאשר טקסט בעל אותו אורך. קושי התחזוקה על בעל האתר גדול מאוד, כי הוא צריך להכין ולערוך את התמונות מתוך קובץ מקור של טקסט.
דפדפן Netscape כשלעצמו אינו תומך בערבית, אך יש אפשרות להוריד תוסף בשם סינדבד מחברת התוכנה המצרית צח'ר, אשר מקנה תמיכה ערבית לדפדפן. אלא שהתמיכה הזאת אינה פועלת באופן מושלם, ומפתחי אינטרנט ערבים ממליצים שלא להשתמש בה, ולצפות בערבית דרך הדפדפן של מיקרוסופט או דפדפנים אחרים תומכי ערבית, כמו AraMosaic של חברת Langbox.
השער הערבי הגדול ביותר, Ayna (בערבית "איפה"), הוא דוגמא טובה למצב המסובך בערבית. הוא תוכנן כך שכל אחד יוכל לצפות בו, ולכן יש לו ארבע גרסאות: ערבית של Windows (הגרסה הראשית), ערבית של ISO, ערבית בקידוד UTF-8 (יוניקוד) וגרסת תמונות GIF. ודאי שעם מבחר כזה לא יהיה גולש אחד שלא יוכל לצפות באתר, אך עול התחזוקה על אתר כזה כבד מאוד. מי שמפתח ערבית באינטרנט ורוצה יכולת צפייה מירבית, מוטב שיבנה שתי גרסאות לאתר: אחת בטקסט (רצוי ערבית של Windows, שהיא הנפוצה ביותר) ואחת בתמונות. אבל אולי עדיף לא לתת גרסת תמונות, כדי לעודד את המשתמשים לעבור לדפדפנים התומכים בערבית.
[הקודם] [תוכן העניינים] [הבא]