ما هي العبارات غير المحتملة إحصائيا؟

العبارات غير المحتملة إحصائيًا ، أو SIPs ، هي تقنية بحث تم تطويرها بواسطة Amazon.com للبحث في محتوى الكتب عن العبارات الواردة فيها والتي من المحتمل أن تكون فريدة أو تحدث كثيرًا. هذا جزء من برنامج تكنولوجيا Search Inside! ® الحاصل على براءة اختراع من أمازون. بشكل أساسي ، يمنح Search Inside® وصول Amazon إلى النص الجزئي أو الكامل للكتاب ، بحيث يمكن استخدام عبارات معينة لتحديد هذا الكتاب إذا تم استخدام عبارات غير محتملة إحصائيًا في البحث.

اسم هذه التكنولوجيا محير بعض الشيء. عند إجراء بحث ، فأنت تريد أن يتطابق ما تبحث عنه بشكل وثيق. من خلال تحديد عبارة فريدة في كتاب ، إذا كنت تستخدم هذه العبارة للبحث ، فمن غير المحتمل أن يدرج بحثك شيئًا لا تريده. إذا كنت تبحث عن كتاب معين ولا يمكنك تذكر العنوان ولكن يمكنك تذكر اقتباس منه ، فيمكنك استخدام الاقتباس للبحث عن الكتاب.

بالتناوب ، قد ترغب في البحث عن موضوع معين ، ضمن موضوع أكبر. على سبيل المثال ، إذا كنت ترغب في البحث عن كتاب يحتوي على نصائح مهنية ، ولكن ما أردت حقًا أن تقرأ عنه هو كيفية التواصل مع الوظائف ، فقد تبحث عن “الشبكات” بدلاً من “المشورة المهنية”. تظهر على الفور بعض عمليات البحث الأكثر صلة على صفحة نتائج بحث أمازون بما في ذلك كتب مثل Dig Your Well Before You Thirsty: كتاب الشبكات الوحيد الذي ستحتاج إليه.

إذا كنت قد بحثت باستخدام هذه الأنواع من العبارات غير المحتملة إحصائيًا ، فقد تلاحظ أنه يمكنك الحصول على نتائج ليست مطابقة تمامًا. على سبيل المثال ، العائد الأول للبحث عن الشبكات ليس للشبكات المهنية ، ولكن لمعلومات شبكة الكمبيوتر والتكنولوجيا. يمكنك إنشاء عبارات أفضل غير محتملة من الناحية الإحصائية بأن تكون أكثر تحديدًا. على سبيل المثال ، يمكنك الحصول على نتائج أفضل من خلال البحث ضمن الشبكات المهنية أو الشبكات الوظيفية.

العبارات غير المحتملة إحصائيًا هي في الواقع عبارات محتملة ، نظرًا لأنها على الأرجح عبارة فريدة في كتاب “البحث في الداخل”! ستتصدر قائمة الأشياء التي تبحث عنها. يمكنك على سبيل المثال إدخال سطر من شكسبير من سونيت شكسبير لإحضار كتب عن شكسبير. لا يعمل هذا دائمًا بشكل جيد نظرًا لاستخدام بعض الاقتباسات المعروفة في العديد من الكتب الأخرى كعناوين. لن تجد هاملت إذا كنت تبحث عن “أكون أو لا أكون”. ولن تجد ماكبث بعبارات غير محتملة إحصائيًا مثل “Out! Out! بقعة اللعنة “. في الواقع ، بموجب هذا المصطلح الأخير ، فإن أول كتاب ستجده هو كتاب عن إزالة البقع.

يعد استخدام عبارات غير محتملة من الناحية الإحصائية أيضًا طريقة للبحث عن محتوى الويب ، وقد تستخدم برامج زحف الويب تقنية مماثلة حتى يتمكن الأشخاص من البحث بشكل أكثر فاعلية وتحديدًا عن سطور معينة فريدة. إنها ليست تقنية مثالية لأن زاحف الويب لا يقوم بالضرورة بتقييم المحتوى. قد يبحث عن تكرار الكلمات الرئيسية التي تسمح للأشخاص بالعثور على قطع ذات عدد أكبر من تكرار الكلمات الرئيسية. ليست كل الكتب على Amazon مزودة بتقنية Search Inside! ® ، ولكن يبدو أن هذا هو الاتجاه السائد. في النهاية ، حتى لو كان النظام معيبًا بعض الشيء ، فقد يقلل من وقت البحث.