دقت فناوری تشخیص گفتار مایکروسافت افزایش یافت
نرخ خطای کلمه در فناوری تشخیص گفتار شرکت مایکروسافت هماکنون به ۵.۱ درصد کاهش یافته است.
فناوری تشخیص گفتار شرکت مایکروسافت تقریبا به دقتی در سطح انسان رسیده است. تیم تحقیقاتی مایکروسافت اعلام کرده که نرخ خطای کلمهی سیستم تشخیص گفتار این کمپانی اکنون فقط ۵.۱ درصد است. درحالیکه نرخ خطای کلمه (WER) در سیستم یادشده قبلا ۵.۹ درصد بود. در سپتامبر سال گذشته، ردموندیهای موفق شدند نرخ خطای کلمهی فناوری تشخیص گفتار خود را به ۶.۳ درصد برسانند و حالا این کمپانی با پیشرفته کردن مداوم این سیستم، طی سال جاری توانسته است نرخ خطای کلمه را به ۵.۱ درصد کاهش دهد. این شرکت همچنین در طول سال گذشته موفق شد نرخ خطای فناوری تشخیص گفتارش را به میزان قابل توجه ۱۲ درصد کاهش دهد.
در گزارشهای پیشین عنوان شده که نرخ خطای کلمهی انسان در حال حاضر معادل ۵.۱ درصد است و این یعنی سیستم تشخیص گفتار مایکروسافت دقتی در حد دقت انسان دارد. رسیدن به چنین نقطهای برای شرکت مایکروسافت یک موفقیت بسیار بزرگ محسوب میشود؛ زیرا این کمپانی در ۲۵ سال گذشته سعی زیادی کرده است تا بتواند خدماتی در سطح توانایی انسان ارائه دهد.
ردموندیها در یک گزارش فنی به ذکر جزئیاتی در این رابطه پرداختهاند. این شرکت در گزارش نامبرده توضیح داده است که چگونه با استفاده از ترکیب یک شبکهی عصبی کانولوشن و حافظهی بلندمدت و کوتاهمدت دوطرفه، موفق شده به چنین نرخ خطای پایینی دست یابد. مهندسان مایکروسافت همچنین روی ارتقاء مدلهای زبان مبتنی بر شبکههای عصبی کار کردهاند تا با بهره گرفتن از آن بتوانند نرخ خطای کلمه را در تکنولوژی تشخیص گفتار این کمپانی، کاهش دهند. مایکروسافت همچنین مدعی شده است که سرمایهگذاریهای انجامشده توسط این کمپانی در بخش کسبوکارهای مرتبط با فضای ابری، باعث شده فرآیند آموزش برای مدلهای زبان این شرکت با سرعت بیشتری انجام شود.
فناوری تشخیص گفتار مایکروسافت در سراسر سیستمعامل ویندوز، دستیار دیجیتال کورتانا، مجموعهی آفیس و سرویسهای شناختی مورد استفاده قرار گرفته است. حال با افزایش دقت این سیستم، احتمالا کاربران مایکروسافت طی ماههای آينده از مزایای آن بهره خواهند برد. البته نباید فراموش کنیم که هماکنون کمپانی رقیب مایکروسافت یعنی گوگل، موفق شده است نرخ موفقیت سیستم تشخیص گفتار خود را به ۹۵ درصد برساند.
نظر شما در این مورد چیست؟