בין השנים 1982 ו-1992 נכתבו טקסטים בעברית במחשבים בקידוד DOS בלבד, וגם אחרי הופעת Windows בעברית המשיכו להשתמש בעברית של DOS. מכל התקופה הזו נותרו קבצים רבים של עברית שערכם עשוי להיות גדול אך אי-אפשר לטפל בהם תחת מערכות ההפעלה של היום. פרק זה יעסוק בהמרת עברית של DOS לקידוד ושיטת אחסון שבהם ניתן לטפל בה. המטרה היא שהעברית תאוחסן בשיטה המשתמעת ותקודד לפי התקן של ISO (במספרים 224 עד 250, כמו במערכת Windows עברית) או ביוניקוד (בשביל העבודה ב-Windows 2000 בשלב מאוחר יותר).
הדפדפן Internet Explorer, רצוי בגרסה 5 אף כי גם גרסה 4 מסוגלת לעבוד עם קידודים שונים, משמש להצגה של טקסט בקידודים שונים וגם להמרה בין קידודים קרובים (למשל בין קידודי העברית השונים). קודם-לכן ראינו את האפשרויות האלה בתפריט הקידוד:
כבר ציינתי ששלושת קידודי העברית האחרונים משמשים לצפייה בעברית באינטרנט ממש ואילו קידוד העברית של DOS אין לו שימוש באינטרנט (לא יצא לי עדיין לראות שום דף אינטרנט המקודד בעברית של DOS). אבל בכל-זאת טוב מאוד שהאפשרות הזו נמצאת, משום שהיא שימושית לטיפול בקבצים ישנים. אף אם אין למערכת תמיכה בעברית של DOS (כמו Windows 2000), אפשר להציג עברית של DOS על-ידי גרירת קובץ הטקסט אל תוך הדפדפן ובחירה בקידוד עברית של DOS.
בנוגע לעברית של DOS כפי שהיא מוצגת בדפדפן Internet Explorer, יש להעיר הערה חשובה: הדפדפן מציג אותה בשיטה המשתמעת. כלומר, עברית רגילה של DOS, המאוחסנת בשיטה החזותית כפי ש-DOS רגיל להציג אותה, תופיע בסדר הפוך. עברית של DOS המאוחסנת בשיטה המשתמעת (כמו זו שנוצרה במעבד תמלילים העובד בשיטה המשתמעת) תופיע בסדר ישר. המצב הטוב יותר הוא כמובן שהעברית תופיע בסדר ישר, ואז לא נותר אלא להמיר את הקידוד. בוחרים באפשרות Save As מתוך התפריט של הדפדפן ומקבלים את החלון הבא:
לא נותר אלא לבחור אחד משלושת קידודי העברית התחתונים ולשמור, ואז יווצר קובץ טקסט בעברית של Windows. ב-Windows 2000 אפשר לבחור ב-Unicode או UTF-8 כדי להמיר את הקובץ היישר לקידוד יוניקוד של המערכת.
ועכשיו יש לציין נקודה חשובה אודות קידוד ISO-Visual של עברית שאנו רואים כאן מבין האפשרויות. הנקודה החשובה היא שההמרה לקידוד זה אינה הופכת את שיטת אחסון התווים. קידוד ISO-Visual של עברית משנה את התצוגה בלבד, כלומר גורם לביטול הכיווניות העברית ועל-ידי כך להצגה נכונה של עברית חזותית בדפדפן. אבל ההמרה לקידוד ISO-Visual כמוה כהמרה לקידוד עברית של Windows - היא משנה רק את הקידוד, היא רק מעבירה את קידוד האותיות העבריות למקומות 224 עד 250. וכך גם עברית חזותית, אם תמירו אותה לעברית של Windows, לא יקרה שום דבר. הדפדפן ממיר בין קידודים אך לא בין שיטות אחסון. כדי להמיר עברית חזותית למשתמעת ולהפך יש להשתמש בתוכנה ייעודית כמו HebTML.
לכן אם בהצגת קובץ עברי של DOS אתם רואים עברית בסדר הפוך, הדבר הראשון שצריך הוא להמיר אותו לעברית של Windows (גם ב-Windows 2000; ולא ליוניקוד, מכיוון שתוכנות כמו HebTML אינן יודעות לעבוד עם עברית של יוניקוד). לאחר ההמרה יש להעתיק את כל הטקסט העברי ההפוך ולהדביק בתוך תוכנת ההפיכה ולהפוך לעברית משתמעת. שבירת השורות המקורית של האחסון החזותי נשמרת, אך זו אינה בעיה. בעברית הזו כבר אפשר לטפל, לערוך, לשלב במעבד התמלילים וכל הפעולות הרגילות.
על-ידי שילוב זה של המרת הקידוד באמצעות Internet Explorer והמרת שיטת האחסון באמצעות תוכנה ייעודית ניתן "לשדרג" את רוב קובצי העברית של DOS לקבצים מודרניים יותר. קובצי עברית של DOS מהווים את הרוב המכריע של קבצים הגורמים כאב ראש למשתמשי עברית במחשבים. הקבצים הנוספים שעלולים לעשות צרות הם קובצי האינטרנט העבריים המאוחסנים בשיטה החזותית (ואותם יש רק להמיר לשיטה המשתמעת), וקובצי עברית עם ניקוד של מקינטוש (כאמור, מערכות Apple מקצות מקום שונה לניקוד עברי מאשר מערכות Windows, אף כי האותיות עצמן בקידוד זהה). קבצים כאלה אפשר להמיר באמצעות Windows 2000, מחלון שורת הפקודה (תחילה ממירים ליוניקוד ואחר-כך אפשר להמיר לעברית של Windows; ראו בפרק על עברית תחת Windows 2000 להדרכה על המרת קידודים מחלון שורת הפקודה).
[הקודם] [תוכן העניינים] [הבא]