جعلت Amazon من السهل إضافة الأصوات إلى مهارات Alexa المخصصة

لقد تم الاعتراف بي بصفتي بطل Amazon Alexa وقد نشرت أكثر من عشرين مهارة مخصصة على المنصة. ما زلت أبحث عن طرق جديدة لتوسيع هذه التكنولوجيا ، وأحد أفضل الطرق التي وجدتها لتحسين تجربة المستخدم هي إضافة الأصوات. نظرًا للتحسن الأخير في منصة Amazon Alexa ، فقد أصبح هذا الأمر أكثر سهولة. فيما يلي استعراض موجز لكيفية الاستفادة من هذه الميزة الجديدة.

كيف يعمل Amazon Alexa

تتمتع منصة Alexa بالقدرة على تمكين المهارات المخصصة التي يصنعها مطورو الطرف الثالث. يوجد الآن أكثر من 30 ألفًا منها ، ويمكن لملايين مستخدمي Alexa تمكينها على أجهزتهم. تتراوح هذه من طلب بيتزا من سلسلة شعبية إلى تشغيل الأصوات للمساعدة على النوم.

تتكون بنية هذه المهارات المخصصة من عنصرين. الأول هو المكون الصوتي الذي يستفيد من نماذج التعلم الآلي لمنصة Alexa. هذا ما يترجم طلبات الكلمات المنطوقة إلى مجموعة من التعليمات.

المكون الآخر هو منطق if / then / else الذي يقرر الإجابة التي يجب أن تعود إلى المستخدم. هذا مستضاف على وظيفة AWS Lambda.

لتعزيز المهارات ، يمكن استخدام خدمات AWS الإضافية ، وكذلك أدوات الجهات الخارجية. يتضمن ذلك تسجيل أصوات ورسومات MP3 مخصصة يمكن الاستفادة منها بواسطة وظيفة Lambda.

لإضافة أصوات ، يتم تحميل ملفات MP3 في حاوية S3 ، ويتم تطبيق سياسة الوصول المناسبة بحيث يمكن قراءتها بواسطة جهاز Alexa.

التحديات مع إضافة أصوات مخصصة

كانت إحدى العوائق التي تحول دون إدخال الأصوات في المهارات المخصصة هي القدرة على تسجيل أصوات عالية الجودة. يجب أن تتوافق هذه الأصوات مع المعايير الدقيقة للمنصة ، بما في ذلك معدل البت ومعدلات العينة. يمكن القيام بذلك من خلال خبرة تحرير الصوت باستخدام برنامج مثل Audacity ، ولكنه يضيف وقتًا لتطوير المهارة.

يمكن أن يمثل تسجيل أصوات عالية الجودة تحديًا أيضًا. توجد تطبيقات للأجهزة المحمولة تتيح التسجيل ، ولكن يصعب الوصول إلى مجموعة متنوعة من الأصوات. على سبيل المثال ، تسجيل هدير طائرة ، أو صوت الفيل.

بدلاً من ذلك ، يمكن لمطور Alexa البحث عن الأصوات التي تم تسجيلها بواسطة الآخرين. هناك بعض المستودعات على الإنترنت التي تحتوي على هذه ، ولكن معظمها يكلف مالًا للترخيص ويتطلب إعادة تشكيله باستخدام برنامج مثل Audacity للحصول على سمات الصوت الصحيحة.

محتوى MP3 مجاني

نشرت أمازون الآن كتالوجًا بمئات الأصوات المسجلة بالفعل وفقًا للمعايير الدقيقة التي تتطلبها المنصة. تمامًا كما هو الحال في الرسم التخطيطي للهندسة المعمارية أعلاه ، يتم نشرها في حاوية S3 على AWS ويمكن استخدامها بواسطة أي مهارة مخصصة.

يتم توفير القائمة الكاملة في صفحة المطور ، وهنا الفئات الرئيسية.

النطاق واسع. محركات الدراجات النارية وضوضاء الألعاب النارية وزئير الدب كلها في متناول يدك. لا توجد حقوق ملكية مطلوبة لاستخدامها ، ولا يتم تحميل تكلفة تنزيل مقاطع الصوت على حساب AWS الخاص بك.

كيفية استخدام الصوت في مهارة أساسية

إذا كنت بدأت للتو مع Amazon Alexa ، فابدأ بالقوالب الأساسية من صفحة Alexa GitHub. يتضمن ذلك بناء مهارة معلومات عامة أو مهارة معرفة الحقائق أو ألعاب تخمين بسيطة. على سبيل المثال ، قمت مؤخرًا بنشر مهارة ممتعة للأطفال تسمى Easter Egg Hunt. هذا هو الريبو الكامل على GitHub ، بما في ذلك وظيفة Lambda بالإضافة إلى نموذج النية.

مع أي من الردود على الرسائل ، يمكنك إضافة بناء جملة SSML لتضمين ارتباط إلى ملف MP3 في حاوية S3. هذا مثال من معالج الترحيب لمهارة بيض عيد الفصح.

// This is the initial welcome message var welcomeMessage = "Welcome to the Easter Bunny Egg Hiding Game. I will ask you multiple questions that you should answer yes or no. Based on your choices, I will make a recommendation on where to hide an egg. Are you ready to begin?"; this.emit(':ask', welcomeMessage, repeatWelcomeMessage);

عندما يستدعي المستخدم هذه المهارة المخصصة لأول مرة ، يقوم جهاز Alexa بتشغيل مقطع الصوت لبوق البوق ، ثم يقرأ بناء الجملة مع الصوت القياسي.

على استعداد للبدء؟

انطلق واشترك للحصول على حساب مطور مجاني على أمازون ، وابدأ في بناء مهارتك الأولى اليوم! تحتوي مدونة مطوري Amazon على بعض الموارد الرائعة للاستفادة منها في هذا الموضوع ، بما في ذلك هذا المنشور الأخير الذي يقدم أفكارًا حول كيفية استخدام هذا المحتوى الجديد.