אחסון נתונים במחשבים

האותיות אשר אתם קוראים על גבי המסך הן אותיות לגביכם, בתור קוראים אנושיים. לגבי המחשב, אין הן אלא מיפויים של צורות גראפיות חסרות משמעות לפי מספרים שנקבעו מראש. המחשב תוכנן כך שהוא יכיר את סדרת המספרים הזו:

01000001

שהיא לפי השיטה העשרונית 65, ואז יציג אותה על המסך כך:

A

לפיכך המספרים הבינאריים הללו (סדרות של אחדות ואפסים, שהם למעשה סימונים לפתיחה וסגירה של מעגלים חשמליים) משמשים לאחסון נתונים שבני-אדם יכולים לקרוא. עוד לפני המצאת המחשב אוחסנו מילים על גבי נייר מנוקב שבו המיקום של החורים סימן את האותיות. מספר התווים שאפשר לאחסן תלוי בהגדרה של הקצאת המספרים לתו אחד, כלומר כמה מהספרות הבינאריות ישמשו לסימון תו אחד. בכל מספר של ספרות בינאריות ניתן לאחסן 2 בחזקת אותו מספר של ספרות. כלומר, אם יש לנו 8 ספרות כמו בדוגמא למעלה, אז ניתן לאחסן 256 תווים נבדלים. הגדרת התו היחיד התרחבה ככל שעמדו עוד משאבים לרשות המחשבים וככל שגדלו צורכי העבודה בתווים שונים.

בשנות ה-50 וה-60 היו המחשבים עניין למומחים בלבד. הם תפסו בניינים שלמים והיו נגישים רק למתי מעט אשר הכירו את שפת המכונה, את הברזלים של המחשב ממש. מחשב בכל בית היה בבחינת מדע בדיוני, ולשפות אחרות כמעט שלא נזקקו. ההנחה הייתה שאם מישהו כבר ירצה להתמחות במחשבים, אז ודאי יהיה מוכן ללמוד אנגלית לשם כך. המחשבים הכירו תחילה רק את שפת המכונה הבינארית, ואחר-כך הומצאו שפות-תיווך הקרובות יותר לשפת אנוש - באנגלית, כמובן. כשנוצר הצורך לטפל בשפות אחרות, לצורך רשומות וחשבונות קצרים ואקראיים, נמצאו פתרונות מאולתרים. רק כשהטיפול בשפות האחרות הפך נפוץ יותר, אז נאלצו לתת תמיכה מסודרת לשפות האלו.

אורך התו היחיד היה תחילה, בעקבות מוסכמות הטלגראף, בן 5 ספרות. בכך היה מקום ל-32 תווים נבדלים: אותיות לטיניות גדולות בלבד וכמה סימני פיסוק. עם גידול ההגדרה ל-6 ספרות אפשר היה להכניס מספרים ועוד סימני פיסוק ללא תעלולים מיוחדים. בתקופה הזו, בשנות ה-60, הוחל בשימוש בעברית במחשבים. לכל יצרן מחשבים הייתה שיטה משלו לאחסון התווים, והתקשורת בין מחשבים של יצרנים שונים הייתה קשה ביותר. ואולם המבחר לא היה גדול ביותר. בישראל השתמשו בעיקר במחשבים של יבמ (IBM), בייחוד דגם 1401 הפופולרי*. מכיוון שהמבחר היה קטן, ודאי לא היו מחשבים ייעודיים לעברית, אלא היה צריך להתאים מחשב שיודע לעבוד עם אותיות לטיניות בלבד, לטיפול בעברית. אז עוד לא היה הרבה טקסט עברי ביישומים - אלה היו בעיקר יישומי הנהלת חשבונות למיניהם - והבעיה העיקרית הייתה איך להציג את העברית באופן שיהיה קריא לדובר השפה. כתיבת העברית הייתה בעיה קשה יותר מהצגתה, היות שהמחשבים של אז נבנו עם הנחת היסוד של הזנת נתונים משמאל לימין בלבד, אך מכיוון שהטקסט היה מועט, אפשר היה לסבול זאת, או לאלתר פתרונות. החשוב ביותר היה שיופיע טקסט עברי קריא על נייר החשבון המופיע אצל הלקוח.

כדי להציג עברית על המחשבים של יבמ, ובעצם על כל מחשב לפני עדיין המחשב האישי ומערכת ההפעלה DOS, השתמשו בקידוד הנקרא "קוד ישן" (Old Code) ובאחסון חזותי (Visual) של האותיות העבריות. על המושגים הללו כתבתי בשני הפרקים הבאים.


*תודה ליונתן רוזן על המידע הרב שסיפק לי על המימושים הראשונים של עברית במחשבים.


[הקודם] [תוכן העניינים] [הבא]