ما هو تزييف الوقت الديناميكي؟

يتضمن التواء الوقت الديناميكي (DTW) طريقة حساب ، تسمى خوارزمية ، لمقارنة الأصوات والفيديو والرسومات التي قد تكون متشابهة ولكن قد تحتوي عينات منها على اختلافات طفيفة. تصيغ الحسابات نموذجيًا تمثيلًا خطيًا للعينة ، وتقيس الاختلافات كدالة للوقت. يمكن تعيين عناصر مختلفة لعينة ما على شبكة لتحديد أوجه التشابه ، بينما تستخدم أوامر الوظائف غالبًا رموزًا لتحديد كل متغير. على سبيل المثال ، يستخدم التعرف على الكلام أحيانًا تشويه الوقت الديناميكي لمطابقة الكلمات حتى لو تم التحدث بها بسرعات مختلفة أو تم نطق أجزاء معينة بشكل مختلف.

تستخدم العديد من برامج التعرف على الكلام تزييف الوقت الديناميكي لأن الناس غالبًا ما يتحدثون بمعدلات مختلفة. قد يتم نطق بعض أصوات الحروف المتحركة بشكل مختلف اعتمادًا على العواطف أو عوامل أخرى. يمكن لبعض البرامج التعرف على الكلمات المنطوقة بغض النظر عمن يتحدث. لهذا السبب ، عادة ما يكون من غير الفعال جمع المسافات في فترات زمنية لمقارنة الأصوات. باستخدام DTW ، يتم تحليل نقاط زمنية مختلفة لكل إشارة ؛ يتم حساب هذه المسافات على شبكة تمتد من أسفل اليسار إلى أعلى اليمين.

يمكن قياس أوجه التشابه في الأجزاء المقابلة لعينتين باستخدام مسافة Levenshtein. تستخدم الحروف لتمثيل التغييرات بين مصدر وآخر. عادةً ما يكون حل الخوارزمية عبارة عن رقم أكبر كلما كانت العيّنات أكثر اختلافًا. غالبًا ما يستخدم هذا المفهوم للتعرف على الكلام وكذلك التدقيق الإملائي وتحليل المواد الجينية.

في بعض القياسات ، يمكن لتغييرات التردد أن تعوض قدرة التواء الوقت الديناميكي. يمكن حساب الإشارات بطريقة يتم فيها استخدام شكلها بغض النظر عن التردد. يمكن أن تشكل الإشارات المعدلة مشكلة أيضًا ، لكن الشبكة التي تحسب المسافات بين مقاطع الخط بدلاً من النقاط يمكن أن تعوض.

تعد محاذاة التسلسل عملية رياضية بشكل عام وهناك حاجة إلى بعض مهارات برمجة الكمبيوتر لفهمها بالكامل. تعتمد خوارزميات التواء الوقت الديناميكي على بعض الشروط الأساسية لحساب الاختلافات الواقعية بين العينات الصوتية أو المرئية. بالنظر إلى العينة كمسار على طول الشبكة ، غالبًا ما تتبع الخوارزمية القواعد ، مثل لا يمكن للمسار الرجوع إلى الوراء وأنه يتم قياسه خطوة واحدة في كل مرة. بالإضافة إلى التنسيق من أسفل اليسار إلى أعلى اليمين ، تقتصر القياسات على المواقع القريبة من خط قطري. غالبًا ما يتم تجاهل القيم شديدة الانحدار أو الضحلة لأنها يمكن أن تسبب أخطاء في القياس النهائي.