2024 מְחַבֵּר: Malcolm Clapton | [email protected]. שונה לאחרונה: 2023-12-17 03:56
הבנת פורמטי שמע דיגיטליים אינה קלה כלל וכלל. קשה עוד יותר להגיע למסקנה חד משמעית באיזה פורמט עדיף להאזין למוזיקה. אם תסתכל על הטבלה ההשוואתית של פורמטי אודיו בוויקיפדיה, העיניים שלך יתחילו להתפזר בעמודות של מספרים אילמים. בואו ננסה להבין מה עומד מאחורי זה.
בואו נסתיימר מיד שהמאמר מדבר רק על מאפיינים כלליים ולא יכלול כמה פרטים. בעתיד, Lifehacker תערוך מחקר נטול פניות משלה. והיום ננסה להכליל את החוויה שכבר ידועה בצורה כזו או אחרת.
יש אנלוגי ודמות.
אנלוגי זה טוב, אבל קצר מועד ולא נוח. לכן, מדיה אנלוגית, למרות מכירות ויניל גבוהות, לא תחזור.
אודיו דיגיטלי יכול להיות משלושה סוגים עיקריים:
- בפורמט שאינו משתמש בדחיסה;
- בפורמט המשתמש בדחיסה ללא אובדן;
- בפורמט המשתמש בדחיסה מאבדת.
במבט ראשון, פורמטים ללא הפסדים מבטיחים יותר. זה לא תמיד המקרה, כפי שנדון ביתר פירוט באחד החומרים הבאים. פורמטים לא דחוסים אינם הגיוניים מלבד אחסון הקלטות המאסטר הדרושות ליצירת תוכן אודיו. קל יותר לשחזר אותם. לאחסן ולהאזין להקלטות ביתיות מיותרים.
מבין הפרמטרים הרבים של אודיו דיגיטלי, למשתמש צריך קודם כל לדאוג לתדירות הדגימה (הדיוק של דיגיטציה של אות אנלוגי בזמן), עומק סיביות (דיוק הדיגיטציה במשרעת - עוצמה), קצב סיביות (כמות של מידע הכלול בקובץ לשנייה).
היום נדבר על אובדן.
עבור סאונד דחוס, הרעיון של המודל הפסיכו-אקוסטי חשוב מאוד - הרעיונות של מדענים ומהנדסים לגבי האופן שבו אדם תופס צליל. האוזן קולטת את כל ספקטרום הגלים האקוסטיים המגיעים אליה. עם זאת, המוח מעבד את האותות.
ערך הייחוס של הטווח הנשמע לאדם הוא מ-16 הרץ עד 20 קילו-הרץ, אך הוא אינו מסוגל לשמוע בו-זמנית ולהיות מודע לכל הצלילים הנכנסים.
השמיעה דיסקרטית והרגישות השמיעתית שלה אינה ליניארית.
מודלים פסיכו-אקוסטיים מודרניים מעריכים במדויק את השמיעה האנושית ומשתפרים כל הזמן. למעשה, למרות הבטחותיהם של אוהבי מוזיקה, מוזיקאים ואודיופילים, עבור האוזן הממוצעת הבלתי מאומנת, המראה הראשוני של MP3 באיכות מקסימלית הפך להיות מורגש ביותר. יש יוצאים מן הכלל, הם לא יכולים שלא להתקיים. אבל לא תמיד ניתן להבחין בהם בקלות בהאזנה עיוורת.
פורמטים באמצעות מודלים של דחיסה פסיכואקוסטית
יש הרבה פורמטים כאלה לדחיסת אודיו מאבדת. הנפוצים ביותר כיום הם הבאים.
OGG (וורביס)
באופן כללי, קובץ עם הסיומת *.ogg הוא "מיכל": הוא יכול להכיל מספר הקלטות קול עם תגים ומאפיינים משלו. לרוב, הקבצים המאוחסנים בו נדחסים עם ה-Codec Ogg Vorbis, אם כי ניתן להשתמש באחרים, כולל MP3 או FLAC.
היתרונות העיקריים שלו כוללים מגוון רחב של פרמטרים אפשריים במהלך הקידוד: קצב דגימת השמע יכול להגיע ל-192 קילו-הרץ, עומק הסיביות הוא 32 סיביות. כברירת מחדל, OGG משתמש בקצב סיביות משתנה (אם כי זה לא מוצג בתצוגת המאפיינים), שיכול להגיע עד 1,000 kbps.
MP3
בניגוד ל-OGG החינמי, MP3 פותח על ידי אגודת Fraunhofer, איגוד של מכונים גרמניים למחקר יישומי, שהוא חשוב מאוד לאקוסטיקה המודרנית. בין האודיופילים, אגב, מדובר במשרד מכובד ביותר, אולם הם לא אוהבים להודות בכך. אבל ההתפתחויות שלהם נבדקות מקרוב.
שלא כמו OGG, זה יכול להיות משתנה (VBR) וגם קצב סיביות קבוע (CBR). אגב, בזכות MP3 התגלה שלא כל הקלטה ניתנת לקידוד באיכות גבוהה עם קצב סיביות משתנה (ראה את הסיבות לעיל, אלגוריתמי הקידוד ותוצאותיהם במקרה זה עשויות להיות שונות בעת קידוד אותו מקור).
בשל גילו המתקדם, ל-MP3 מגבלות משמעותיות: עומק הסיביות יכול להיות 16-24 סיביות, תדירות הדגימה מתבטאת רק בערכים בדידים (8, 11, 025, 12, 16, 22, 05, 24, 32, 44, 1, 48), קצב סיביות מוגבל ל-320 kbps. בנוסף, בגרסה הרגילה של MP3, מספר הערוצים מוגבל לשניים.
AAC
אותה מגרפה, רק בפרופיל. פותח גם על ידי אגודת Fraunhofer. מאוחר יותר ומשתמש במודל פסיכואקוסטי אחר, מודרני יותר. מידע זמין לציבור מאפשר לנו להסיק: כן, הם הצליחו לשפר את היצירה שלהם.
אפילו עם המספרים הבסיסיים ביותר, AAC הוא פורמט גמיש יותר. עומק הסיביות של הקבצים המתקבלים בעזרת פיתוח זה נע בין 16 ל-24, תדירות הדגימה, אם תרצה, תאפשר גם היא לא לאבד את תמונת הקול ונמצאת בטווח של 8-192 קילו-הרץ. זרם הנתונים בדרך כלל מתקרב לאלו של פורמטים ללא אובדן (עד 512 kbps), בעוד שהמספר המרבי של ערוצי קבצי AAC מגיע ל-48.
איזה פורמט הוא ללא ספק הטוב ביותר
בהתחשב בכך ש-AAC הוא MP3 שדמיין מחדש לאחר תריסר שנים, אז הבחירה היא לטובתו. אם תרצה, הגיוני להשוות רק MP3 ו- OGG. בואו נסתכל על התמונות שעשה אנדריי אספידוב המכובד מ-ixbt.com:
על הגרפים - AudioCD טוב, OGG דחוס עם קצב סיביות משתנה של 350 kbps ו-MP3 באמצעות Lame. ככל שהגרף נמוך יותר, כך הצליל קרוב יותר למקור. מסתבר שזו תמונה מאוד מעניינת. למרות העובדה ש-MP3 חתך בבירור תדרים גבוהים, בניגוד ל-OGG, בו ניתן לראות את החסימה מתחת ל-2 קילו-הרץ.
התפלגות התדר-זמן של הצליל מדברת על דברים מעניינים לא פחות. בקצב סיביות קבוע של 320 kbps, ה-MP3 כמעט זהה להקלטה המקורית. נראה שהכל נכנס למקומו עכשיו. אבל… למעשה, הכל עוד יותר מבלבל.
למה בכלל להשתמש ב-lossy כאשר יש זמין הפסד חסר
שכל ישר.
העובדה היא שרוב ההקלטות האנלוגיות אינן מכילות את כמות המידע שתצטרך להיות מאוחסנת בפורמטים באיכות גבוהה. אל תשכח שקצב הדגימה המקורי עבור CD הוא 44.1 קילו-הרץ, הקוונטיזציה היא רק 16 סיביות.
הגרפים הקודמים מדגימים היטב את הנאמנות הגבוהה של שידור MP3. אבל עבור קלטת אודיו, קלטת מגנטי (אלא אם כן, כמובן, מדובר במאסטר טייפ), המאפיינים של AudioCD אינם ניתנים להשגה. ולציוד אולפן המוני, היכולת להקליט סאונד אנלוגי התואם ל- AudioCD הופיעה לאחרונה יחסית. אין טעם לעשות דיגיטציה ב-FLAC (ועוד יותר ב-WAV) הקלטת קונצרטים או דיסק מהתקופה הטרום-דיגיטלית, במיוחד כאלה שעשויים ממדיה מגנטית. הם אינם מכילים את הספקטרים הללו ואת כמות המידע שניתן לאחסן על ידי מכולות ללא דחיסה.
מה השתנה היום
מהנדס סאונד נדיר יוצר הקלטת מאסטר דיגיטלית (שמשוכפלת לאחר מכן במדיה פיזית), תוך שימוש בטכנולוגיות מודרניות במלואן. לכן, הסיכוי שרצועת 24 סיביות היא למעשה רק 16 סיביות הוא גבוה ביותר.
הקלטה אנלוגית באיכות גבוהה על ציוד איכותי קשה עוד יותר למצוא כיום - ולו רק לחובבי הסאונד הזה. כזה, למשל, הוא ג'ק ווייט, המנהיג לשעבר של ה-White Stripes. יחד עם זאת, חלק מההקלטות שלו מתייחסות לווריאציות של lo-fi, וחיפוש אחר מאפייני הסאונד המקוממים של הרצועה שם הופך לסוג של תענוג לאניני טעם.
אם אתה מדמיין את המקור האידיאלי, אז רק אוזן מיומנת או האזנה בציוד שמע איכותי יאפשרו לך למצוא קובץ דחוס. וכבר על סמך זה (ולא לשכוח את התפיסה), כדאי להגיע למסקנה הבאה:
AAC הכרחי ומספיק לציוד במחיר בינוני, בהיעדרו (ובהיעדר מקורות הניתנים לקידוד ב-AAC) - MP3 עם קצב סיביות קבוע של 320 kbps, שנוצר באמצעות ה-Codec Lame 3.93 (מפתחות מומלצים עבור פענוח: -cbr -b320 -q0 -k -ms).
יוצאי הדופן הם הקלטות שהוקלטו במקור באיכות גבוהה, למשל, שהוקלטו ב-DVD-Audio, SACD, או הקלטות שנאספו במקור ב-DSD (או פורמט דומה) עם קצב סיביות גבוה.
למרות ללא הפסדים יש כמה תכונות. ועליהם נספר בפעם הבאה.
מוּמלָץ:
13 אמיתות חיים שאף אחד לא רוצה לשמוע
מחשבות של גולשים ברשת רגילים על החיים והזמן, בדומה לציטוטים של אנשים מפורסמים. אחד מעניין חדש הופיע לאחרונה ב-Reddit, שמחברו שאל את הקוראים שאלה אחת פשוטה: "איזו אמת אף אחד לא רוצה לשמוע?" בתגובות, משתמשים שיתפו הרבה אמיתות פשוטות שלדעתם, במוקדם או במאוחר יהיה צורך לקבל.
"איפה שיש שניים יש שלושה ואיפה שלושה יש ארבעה": למה אנשים הופכים להורים עם הרבה ילדים
משפחות גדולות גורמות לרוב להפתעה ולמטח שאלות. אמא לארבעה ילדים מספרת על הניסיון שלה, על המניעים ההוריים ועל פלטת הרגשות
באיזה מטבע עדיף לאחסן חסכונות
הדולר והאירו נחשבים ליציבים יותר מהרובל, אבל אם אתה רוצה לפתוח פיקדונות במטבע חוץ, מומחים ממליצים לא להתעכב רק על אחד מהם
האם אתה צריך פורמט RAW לצילום נייד?
האם כדאי להתעסק עם תמונות ללא דחיסה או JPEG סטנדרטי זה מספיק
באיזה פורמט עדיף לשמוע מוזיקה ולמה הכל סובייקטיבי
כבר הזכרנו שהמושג "סאונד איכותי" ו"ציוד איכותי" הוא יחסי מאוד. למה אין כלי נגינה מושלם? תוכן האודיו העיקרי המושמע כיום הוא דיגיטלי באחד מפורמטי הדחיסה החסרים. עבור סאונד דחוס, הרעיון של המודל הפסיכו-אקוסטי חשוב מאוד - הרעיונות של מדענים ומהנדסים לגבי האופן שבו אדם תופס צליל.