באינדיזיין הכל נראה תקין, אך ב-PDF יש שיבושים… מכירים את התופעה?
הנה דוגמה. בתמונה הראשונה, הטקסט כפי שמופיע באינדיזיין:
במבט יותר מעמיק בקובץ האינדיזיין, אפשר לראות שליד האות י יש סימן נסתר של נקודותיים בצבע כחול (:):
מה משמעותן? אם נעתיק אותן לתיבת החיפוש GREP נקבל את הסימן ~I שמבטא את הסימן Index Marker. צַיַּן אינדקס הוא סימן שמשמש את אינדיזיין ליצירת תוכן עניינים, ערכי אינדקס, הפניות מקושרות, הערות PDF וכד’.
לדוגמה, כשאנו יוצרים הפניה מקושרת לפסקה מסויימת בספר כדי לציין את מספר העמוד בו היא מופיעה, מה שיוצר את הקישור הוא הסימן הזה שנשתל בפסקה המקורית, והוא מה שמקושר למשתנה בדף שמפנה אליו. ברגע שהסימן הזה עובר לדף אחר, למשל אם מוסיפים כמה דפים לפניו, המשתנה שואב את מספר העמוד שבו נמצא הסימן הזה.
מכיון שכאן ככל הנראה הסימן מיותר (אני משער שהוא הגיע בטעות מקובץ ה-word, או שהוא סימון של הערת PDF) אפשר למחוק אותו ואז התוצאה תיראה טובה גם ב-PDF.
אך אם יש הרבה כאלו בספר, אי־אפשר לעבור ולמחוק ידנית, אז מה שצריך לעשות זה פשוט לחפש ב-GREP את הסימן ~I ולהחליף בכלום.
אבל זה לא עובד… החיפוש לא מוצא את הסימנים האלה. אם נחפש בחיפוש טקסט רגיל (לא GREP) את הסימן ^I שגם אמור למצוא את ערכי האינדקס, גם כאן לא נמצא כלום.
הסיבה לכך היא שזה מוצא רק ערכי אינדקס אמיתיים שמיועדים להפקת אינדקס (והסימן הנסתר שלהם שונה: ).
כשהחיפוש הקודם לא עבד לי נזכרתי שיש דברים שאי־אפשר לחפש בגרפ וגם לא בחיפוש הרגיל, והדרך היחידה למצוא אותם היא לחפש את קוד היוניקוד שלהם, בחיפוש הרגיל דוקא. בדקתי ואכן אפשר למצוא ולמחוק את כל הסימונים האלה בבת אחת ע”י חיפוש קוד היוניקוד <FEFF> והחלפה בכלום.
שימו לב – אם אתם משתמשים בהפניות מקושרות או שבניתם אינדקס, כדאי לעבור אחד אחד ולא למחוק באופן גורף.
2 תגובות
תודה רבה!!! הטיפ עזר לי מאד, חסך לי שעות רבות של עבודה ותסכול. ישר כח
קורה לי דבר אחר, כאני מייצא לPDF מילים בפונט מסוים הוא פשוט הופך לגיבריש