שיחת אוצר:מיזמים/דיקטה
הרב מערכת אני מעלה דפים בודדים לפי מה שהוצרכתי במסגרת המיזם האם זה בסדר הר יונה (שיחה) 22:18, 5 בפברואר 2023 (IST)
- זה נפלא! לא רק בסדר. חמש שנים ל'אוצר הספרים' - בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 02:21, 6 בפברואר 2023 (IST)
מיזם 'ספריה' ו'תורת אמת'[עריכה]
יש הרבה ספרים בספריה שלא הועלו רש"י ותוס' על כמה מסכתות- (הגם שהרב אויצרניק מתכווין להקלידם כדאי כבר להעלותם והוא יחליפם בעת ההקלדה החדשה והמדוייקת שלו, וכן בירושלמי), פתח עינים לחיד"א, בניהו, בן יהוידע, וכמדו' יש עוד. בפרט שעכשיו גם קבצי ספריה נחסמים ע"י נטפרי.
וגם 'תורת אמת' הרשיון הוא אותו רשיון של דיקטה, למה לא להעלות ספרים משם?
לכאו' כדאי לעשות רשימה של כל הספרים החסרים ולעשות מזה מיזם לכל מזכי הרבים דכאן. וייש"כ על כל ההעלאות עד כאן לזיכוי הרבים! עכ"פ (שיחה) 02:22, 17 במרץ 2023 (IST)
- עכ"פ, מה שלא הועלה מספריא נחלק לשניים - רשי ותוספות (ורמבם) זה בדרך כלל דברים שהם לקחו מוויקיטקסט או מתורת אמת. כנ"ל תורת אמת, הרישיון מגביל אותנו. השת"פ שלנו עם דיקטה מסודר בסיכום של מערכת איתם, שלפיו הגרסה הראשונה תוכל לשמש אותם לכל שימוש (כולל הבונוס החשוב של חלוקה לדפים/סימנים - סדר לוגי שמאד חסר שם) ואילו לגבי הגרסאות הבאות המצב יהיה כמו טקסט שהיה במקור בנחלת הכלל, כלומר בלי דרישות שלהם לגביו. מה שיאפשר את חזון אוצר הספרים היהודי השיתופי לשמר את חוד המאמץ של ההדרה השיתופית באתר אחד (כאן) ולא להתפזר ולאבד את כל הרעיון. מהדורה קמא (שיחה) 02:48, 17 במרץ 2023 (IST)
- מהדורה קמא, קודם כל ייש"כ על העלאת הרוב, האם באמת חלקים מרש"י ותוס' בספריה מקורם בת"א ווק"ט? ומה עם פתח עינים בניהו ובן יהוידע (כבר העליתי על ברכות)? עכ"פ (שיחה) 03:34, 17 במרץ 2023 (IST)
- עמד אם תתן לי קישור לדף שלהם בספריא אוכל לבדוק במוצ"ש. כתוב שם בצורה ברורה מה המקור של כל טקסט כמעט. לגבי פתח עינים אני לא זוכר כעת אבל לגבי בניהו ובן יהוידע אלו ספרים שמן הסתם היו מושכים את תשומת לבי. כמדומני שהם משוחררים שם ברישיון מקביל.
- בפועל, כפי שהבנתי ממערכת בשבוע שעבר, ואני מתייג אותו כדי שיתקן אותי אם שגיתי, העבודה שאנחנו משקיעים כעת בחלוקת החומר של דיקטה לדפים במבנה לוגי מסודר, תהיה ההזדמנות שלנו "להחזיר" לספריא ומשתמשיה הרבים, כי החלוקה הזו תאפשר לדיקטה לתרום גם להם את החומר בצורה הבסיסית שלו. מהדורה קמא (שיחה) 14:44, 17 במרץ 2023 (IST)
- אולי לא הכנסתי כי הם לא כתבו במפורש שזה בנחלת הכלל? לא יודע. הנה התיקייה של בניהו כנראה פתוחה גם בנטפרי, בתוך המסמכים לא כתוב כלום מלבד זה שהטקסט מבוסס על מהדורת 1905. אם תצליח למצוא מקום שבו כתבו במפורש שזה בנחלת הכלל, אשמח לסייע להעלות את החיבור המאד-חשוב הזה. מהדורה קמא (שיחה) 14:47, 17 במרץ 2023 (IST)
- האם תוייגתי בטעות? לצערי כבר זמן רב איני פעיל כל כך באתר. עמיאל • שיחה • כ"ד באדר ה'תשפ"ג • 16:06, 17 במרץ 2023 (IST)
- עמד, א. תוייגת אבל לא בטעות. ב. צערך הוא גם צערנו, מחכים לך. ג. שתהיה לך שבת שמחה, בשבת לא מצטערים על אי-פעילות-באתרי-אינטרנט... מהדורה קמא (שיחה) 16:27, 17 במרץ 2023 (IST)
- אויש. חחח. אכן טעות, אין טעות בעולם - באמת הזדמנות לקרוא לך לסדר... עוד מעט חופש בישיבה. עכ"פ, הכוונה הייתה לתייג אותך כמובן. עין תחת עין. מהדורה קמא (שיחה) 16:29, 17 במרץ 2023 (IST)
- מהדורה קמא, הדף כן חסום בנטפרי. המצב שוה בכל ג' הספרים שהזכרתי, שבקובץ עצמו לא כתבו נחלת הכלל אבל אינו מתו"א או ווק"ט. חשבתי מתחילה ש"סתם ספריה נחלת הכלל". עכ"פ (שיחה) 19:37, 17 במרץ 2023 (IST)
- יכול להיות שבאמת זה כך. אבל אם לא כתבו קשה לסמוך על זה לכאורה. מהדורה קמא (שיחה) 20:24, 18 במרץ 2023 (IST)
- מהדורה קמא, הדף כן חסום בנטפרי. המצב שוה בכל ג' הספרים שהזכרתי, שבקובץ עצמו לא כתבו נחלת הכלל אבל אינו מתו"א או ווק"ט. חשבתי מתחילה ש"סתם ספריה נחלת הכלל". עכ"פ (שיחה) 19:37, 17 במרץ 2023 (IST)
- האם תוייגתי בטעות? לצערי כבר זמן רב איני פעיל כל כך באתר. עמיאל • שיחה • כ"ד באדר ה'תשפ"ג • 16:06, 17 במרץ 2023 (IST)
- אולי לא הכנסתי כי הם לא כתבו במפורש שזה בנחלת הכלל? לא יודע. הנה התיקייה של בניהו כנראה פתוחה גם בנטפרי, בתוך המסמכים לא כתוב כלום מלבד זה שהטקסט מבוסס על מהדורת 1905. אם תצליח למצוא מקום שבו כתבו במפורש שזה בנחלת הכלל, אשמח לסייע להעלות את החיבור המאד-חשוב הזה. מהדורה קמא (שיחה) 14:47, 17 במרץ 2023 (IST)
- מהדורה קמא, קודם כל ייש"כ על העלאת הרוב, האם באמת חלקים מרש"י ותוס' בספריה מקורם בת"א ווק"ט? ומה עם פתח עינים בניהו ובן יהוידע (כבר העליתי על ברכות)? עכ"פ (שיחה) 03:34, 17 במרץ 2023 (IST)
חיבור מסמכים למסמך אחד[עריכה]
התקיות בגיטהאב מחולקות למסמכים רבים, מישהו יודע אם יש דרך מהירה להפוך את כל המסמכים הללו למסמך טקסט אחד ארוך? עמיאל • שיחה • כ"ז באייר ה'תשפ"ג • 16:01, 18 במאי 2023 (IDT)
- עמיאל, בוודאי. שתי דרכים. אחת מסורתית ואחת 'להתפרע'.
- המסורתית: נכנסים למסמך Word בכרטיסיה הוספה, במתחם טקסט, אובייקט --> טקסט מתוך קובץ - ואז מסמנים את כל המסמכים שרוצים לאחד בתיקייה שלהם. בינגו.
- להתפרע: נכנסים ל-ChatGPT ומבקשים: כתוב לי קוד למסמך DAT שיאחד את כל קבצי הטקסט שבתיקייה נבחרת לקובץ טקסט אחד. - מיד תקבל הוראות ליצור קובץ פנקס רשימות עם סיומת .dat ואז להכניס לתוכו את הקוד שהרובוט יתן לך. נפלא מאד... מהדורה קמא (שיחה) 20:27, 18 במאי 2023 (IDT)
400 ספרים בדיקטה[עריכה]
ראו בקישור המתעדכן בדף. נוספו כמאה ספרים נפלאים. חמש שנים ל'אוצר הספרים' - בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 02:36, 18 ביוני 2023 (IDT)
- מדהים! מקווה שהם יוסיפו עוד ונצליח לעמוד בקצב שלהם... עמד • שיחה • כ"ט בסיוון ה'תשפ"ג • 03:52, 18 ביוני 2023 (IDT)
- אכן. על ה-100 האלה הם דיווחו לי לפני תקופה. אבל ככל שזה מתקדם - מדובר בטכניקת זיהוי שמשכללת את עצמה באמצעות בינה מלאכותית והתקווה היא שזה יתן בעתיד אותן תוצאות גם על ספרים שנסרקו באיכות נמוכה יותר, כשזה יקרה - אנחנו לא אמורים לעמוד בקצב כי זה, לשם הדגמה, יוכל לתת המרה של כל מה שיש ב-HebrewBooks... חמש שנים ל'אוצר הספרים' - בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 11:28, 18 ביוני 2023 (IDT)
- בדיוק הבוקר עברתי והורדתי כל מה שנוסף. נכון לחלוק כמובן. מהדורה קמא (שיחה) 11:34, 18 ביוני 2023 (IDT)
- מערכת, יש לך מושג האם הם מתכננים לפתוח את התוכנה שלהם לשימוש חופשי (המרת קובץ PDF שמועלה על ידי המשתמש) או שלפחות יהיה ניתן לבקש המרת ספרים ספציפיים? עמד • שיחה • א' בתמוז ה'תשפ"ג • 20:10, 19 ביוני 2023 (IDT)
- 'נדרשתי לאשר לא שאלוני...' המרת PDF של המשתמש, סביר להניח שתחליף תוכנות כמו ליגטורה ו-ABBYY (פיינרידר) ולכן סביר שיעשו את זה למנויי פרימיום. אבל ספרים ספציפיים עבריים שאתה סורק ומעלה (שאינם זמינים בהיברו בוקס) אני מנחש שכן. מהדורה קמא (שיחה) 01:55, 20 ביוני 2023 (IDT)
- אני יכול לשאול. מה שאני יכול לומר ברמה כלשהי של וודאות שאם זה (1) ספר קודש (2) מהמאה ה-19, שתסרוק באיכות גבוהה (1200 dpi. אולי אפילו 600 אבל אני לא בטוח), הם יטפלו בו. חמש שנים ל'אוצר הספרים' - בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 02:18, 20 ביוני 2023 (IDT)
- 'נדרשתי לאשר לא שאלוני...' המרת PDF של המשתמש, סביר להניח שתחליף תוכנות כמו ליגטורה ו-ABBYY (פיינרידר) ולכן סביר שיעשו את זה למנויי פרימיום. אבל ספרים ספציפיים עבריים שאתה סורק ומעלה (שאינם זמינים בהיברו בוקס) אני מנחש שכן. מהדורה קמא (שיחה) 01:55, 20 ביוני 2023 (IDT)
- מערכת, יש לך מושג האם הם מתכננים לפתוח את התוכנה שלהם לשימוש חופשי (המרת קובץ PDF שמועלה על ידי המשתמש) או שלפחות יהיה ניתן לבקש המרת ספרים ספציפיים? עמד • שיחה • א' בתמוז ה'תשפ"ג • 20:10, 19 ביוני 2023 (IDT)
- בדיוק הבוקר עברתי והורדתי כל מה שנוסף. נכון לחלוק כמובן. מהדורה קמא (שיחה) 11:34, 18 ביוני 2023 (IDT)
- אכן. על ה-100 האלה הם דיווחו לי לפני תקופה. אבל ככל שזה מתקדם - מדובר בטכניקת זיהוי שמשכללת את עצמה באמצעות בינה מלאכותית והתקווה היא שזה יתן בעתיד אותן תוצאות גם על ספרים שנסרקו באיכות נמוכה יותר, כשזה יקרה - אנחנו לא אמורים לעמוד בקצב כי זה, לשם הדגמה, יוכל לתת המרה של כל מה שיש ב-HebrewBooks... חמש שנים ל'אוצר הספרים' - בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 11:28, 18 ביוני 2023 (IDT)
ספרים נוספים בדיקטה - תמוז תשפג[עריכה]
בוקר טוב לחברי בית המדרש כאן, ערב שבת שלום! נוספו בימים האחרונים כמה ספרים חשובים למאגר דיקטה, חלקם עדיין עם קשיי קליטה:
- החדשים בדיקטה
1 | אוצר המלך | מפרשים וחיבורים על הרמב"ם | 1939 | לודז' | ר' צדוק מלובלין | |
2 | איגרא רמה חלק א | מפרשי הש"ס | 1873 | למברג | רבי משה משולם בן שמשון איגרא | |
3 | אמרי אש | שו"ת | 1864 | אונגואר | רבי מאיר אייזנשטטר (אייזנשטט) | |
4 | גושפנקא דמלכא (רמב"ם) | מפרשים וחיבורים על הרמב"ם | 1861 | ליוורנו | ר' פארוז קרסינטי | |
5 | הליכות אליהו (רמב"ם) | מפרשים וחיבורים על הרמב"ם | 1932 | ווילנה | ר' אליהו פיינשטיין | |
6 | המקנה - קונטרס אחרון | מפרשים וחיבורים סביב שו"ע | 1860 | לעמבערג | הרב פנחס הלוי איש הורוויץ | |
7 | הפלאה - קו"א (כתובות) | מפרשים וחיבורים סביב שו"ע | 1861 | ווארשא | הרב פנחס הלוי איש הורוויץ | |
8 | כפי אהרן ש"ס | מפרשי הש"ס (אחרונים) | 1874 | ירושלים | ר' אהרן בן עזריאל | |
9 | כפי אהרן - טור | מפרשי הטור | 1874 | ירושלים | ר' אהרן בן עזריאל | |
10 | כפי אהרן - רמב"ם | מפרשים וחיבורים על הרמב"ם | 1874 | ירושלים | ר' אהרן בן עזריאל | |
11 | ל”ו שערים | ספרי הלכה ומנהג | 1940 | ירושלים | רבי ישראל איסֶרלן בן פתחיה אשכנזי | |
12 | עין מאיר (רמב"ם) | מפרשים וחיבורים על הרמב"ם | 1890 | פרשבורג | ר' מאיר טויבר | |
13 | רא”ה כתובות | מפרשי הש"ס (ראשונים ופוס') | 1923 | וילנה | אהרן הלוי |
לא אספיק לטפל בהם בשבוע הקרוב לפחות וכל הרוצה ליטול את השם יבוא ויטול. מהדורה קמא (שיחה) 04:56, 14 ביולי 2023 (IDT)
עידכון חשון פ"ד[עריכה]
נוספו מעל 100 ספרים חדשים הר יונה (שיחה) 09:21, 8 בנובמבר 2023 (IST)
- הר יונה, תודה על העדכון. יש דרך לזהות אותם בנפרד מכל השאר? מהדורה קמא (שיחה) 14:36, 8 בנובמבר 2023 (IST)
- אני לא מכיר. חשבתי שאתה יודע כי פעם קודמת העלת רשימה הר יונה (שיחה) 19:07, 8 בנובמבר 2023 (IST)
- פעם שעברה העתקתי ומחקתי אחד אחד מה שכבר קיים. בסדר, הסתדרתי והורדתי. נוספו כ-115 ספרים. עדיין לא גמרנו להעלות את הקודמים. מהדורה קמא (שיחה) 02:21, 9 בנובמבר 2023 (IST)
- עודכן עוד כ40 ספרים. כמה שקפץ לי, לא יודע מה היה קודם, שו"ת מהר"י מינץ, מהר"ם פדואה, מהר"ם שיק, מהרלב"ח, דבר אברהם, כמה מספרי ר' צדוק, עוד חלקים משדי חמד בהצלחה. הר יונה (שיחה) 20:32, 13 בינואר 2024 (IST)
- תודה על העדכון. שמתי קישורים פנימיים. גם אני לא מצליח לעקוב מה נוסף עכשיו ומה בעבר. נצטרך להכין רשימה לביצוע ולהתקדם לפי הסדר. בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 20:49, 13 בינואר 2024 (IST)
- לפי מה שזכור לי כל מה שהר יונה הזכיר היה שם כבר חוץ מדבר אברהם. עמד • שיחה • ד' בשבט ה'תשפ"ד • 16:56, 14 בינואר 2024 (IST)
- אני שמתי לב לעדות ביעקב ועץ הדר, כי בעבר התחלתי להקליד אותם. עמד • שיחה • ד' בשבט ה'תשפ"ד • 17:02, 14 בינואר 2024 (IST)
- נ"ל שמצאתי איך לראות מה עלה לאחרונה. השאלה האם זה נפק"מ להסביר אחרי שיש הרבה גם ישנים שלא הועלו הר יונה (שיחה) 21:06, 15 בינואר 2024 (IST)
- כן. זה מעניין. זה מסובך להסביר? בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 01:37, 16 בינואר 2024 (IST)
- ראה https://github.com/Dicta-Israel-Center-for-Text-Analysis/Dicta-Library-Download/blame/main/books.json יש שם סימון מה עלה מתי לפי זמן למטה יש את מה שעלה לאחרונה. כך לפי מה שהצלחתי להבין באנגלית "המשובחת" שלי תעדכן האם צדקתי הר יונה (שיחה) 12:03, 16 בינואר 2024 (IST)
- כן. זה מעניין. זה מסובך להסביר? בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 01:37, 16 בינואר 2024 (IST)
- נ"ל שמצאתי איך לראות מה עלה לאחרונה. השאלה האם זה נפק"מ להסביר אחרי שיש הרבה גם ישנים שלא הועלו הר יונה (שיחה) 21:06, 15 בינואר 2024 (IST)
- אני שמתי לב לעדות ביעקב ועץ הדר, כי בעבר התחלתי להקליד אותם. עמד • שיחה • ד' בשבט ה'תשפ"ד • 17:02, 14 בינואר 2024 (IST)
- לפי מה שזכור לי כל מה שהר יונה הזכיר היה שם כבר חוץ מדבר אברהם. עמד • שיחה • ד' בשבט ה'תשפ"ד • 16:56, 14 בינואר 2024 (IST)
- תודה על העדכון. שמתי קישורים פנימיים. גם אני לא מצליח לעקוב מה נוסף עכשיו ומה בעבר. נצטרך להכין רשימה לביצוע ולהתקדם לפי הסדר. בואו להנגיש את ארון הספרים היהודי, מוגה ומוער, לכולם. מערכת (שיחה) 20:49, 13 בינואר 2024 (IST)
- עודכן עוד כ40 ספרים. כמה שקפץ לי, לא יודע מה היה קודם, שו"ת מהר"י מינץ, מהר"ם פדואה, מהר"ם שיק, מהרלב"ח, דבר אברהם, כמה מספרי ר' צדוק, עוד חלקים משדי חמד בהצלחה. הר יונה (שיחה) 20:32, 13 בינואר 2024 (IST)
- פעם שעברה העתקתי ומחקתי אחד אחד מה שכבר קיים. בסדר, הסתדרתי והורדתי. נוספו כ-115 ספרים. עדיין לא גמרנו להעלות את הקודמים. מהדורה קמא (שיחה) 02:21, 9 בנובמבר 2023 (IST)
- אני לא מכיר. חשבתי שאתה יודע כי פעם קודמת העלת רשימה הר יונה (שיחה) 19:07, 8 בנובמבר 2023 (IST)