Зміст:

Anonim

Я мушу визнати, що давно не використовував будь-якого розпізнавання мовлення, коли мене просили робити підручники. Востаннє я спробував розпізнати мовлення, це було з Dragon Dictate , який був новим, коли Windows 98 також була новою. Дуже давно в комп'ютерні роки!

Я із задоволенням займався цією темою, тому що мені було дуже цікаво побачити, як покращилося розпізнавання мовлення. І хлопче, покращився! Навіть базовий вбудований додаток на кшталт цього зробив дивовижно хорошу роботу "прямо з коробки". У цій заключній статті про розпізнавання мовлення я хотів би поговорити про те, що я дізнався, знайшовшись із чудесами розпізнавання мовлення, і куди я поїду звідси.

Ще не готовий до Star Trek

Я впевнений, що багато хто з нас спостерігали за тим, як команда "Starship Enterprise" казала "Комп'ютер!" і отримати негайну відповідь. У нас поки немає комп'ютерів Starfleet, але, починаючи з Windows Vista і продовжуючи працювати в Windows 7, у нас є комп'ютери, які слухатимуть нас і відповідатимуть на те, що ми їм скажемо, - і відповімо нам, якщо "Що це було?" вважається відповіддю.

У мене були проблеми, коли я вперше спробував використовувати розпізнавання мови , і усунення несправностей не було особливо простим. Файли довідки не завжди є досить корисними. Мені вдалося знайти відповіді на веб-сайті Microsoft і в асортименті інтернет-форумів без зайвої роботи. Ось як я з’ясував, що забув, що моя веб-камера (сидячи прямо переді мною на моніторі та прямо в руслі того, як я говорила) також мала активний мікрофон і додала розгубленості. Як тільки я це зафіксував, відтепер було досить плавне плавання.

Я навіть спробував розмовляти з асортиментом різних наголосів (наприклад, британська та американська дільниця) і зміг отримати досить хороше визнання, що дозволяє розрізняти стандартну американську вимову. Звичайно, кажучи: "Друзі, римляни, земляки, позичіть мені вуха!" в той час, як я робив свої найкращі враження про Хелен Міррен та Джеффа Фоксворі, змусив мене занадто сильно сміятися, щоб отримати цілком точні результати.

Розпізнавання мови

Розпізнавання мови можна використовувати з різними мовами, і я подумав, що я можу спробувати це з моїми обмеженими американськими акцентами, іспанською, німецькою та французькою мовами, але, на жаль, ви не можете використовувати інші мови, якщо ваша операційна система також не є цією мовою. Ви можете змінити мову своєї операційної системи, встановивши інший мовний пакет від Microsoft, але це можна зробити, лише якщо ви використовуєте Windows 7 Ultimate або Windows 7 Enterprise.

Розпізнавання мови доступне для англійської, англійської, англійської, американської, англійської, французької, іспанської, німецької, японської, традиційної китайської та спрощеної китайської, і їх можна знайти у версіях цих мов Windows 7 (усі версії). Мені було шкода, що не змогли спробувати це. Я не маю уявлення, що буде з Windows 8, але я думаю, що можливість встановлення інших мовних пакетів буде гарним доповненням до еквівалентів Windows 8 Professional і вище.

Що добре працює

Як я вже згадував, розпізнавання мови розроблено так, щоб найкраще працювати з іншим програмним забезпеченням Microsoft. Поки я експериментував з продуктами Microsoft, я був дуже успішним (хоча, як можна було очікувати, використання Microsoft Office Excel було і обмеженим, і складним). З іншим програмним забезпеченням воно потрапило або пропустило. Я міг досить добре використовувати браузер Google Chrome (напевно, не так добре, як Internet Explorer ) та свою електронну програму Eudora , яка на сьогоднішній день є майже антикварним програмним забезпеченням. Варто експериментувати з власним улюбленим програмним забезпеченням, щоб побачити, що ви можете зробити. Команда "Показати номери" була особливо корисною при виборі елементів та команд.

Я також виявив, що не піло багато часу, щоб точність розпізнавання помітно покращилася. Я пройшов тренувальні вправи двічі, і після цього розпізнавання було майже на 100% правильним. Я зміг розмовляти трохи швидше і робив менше пауз, щоб програмне забезпечення не було в курсі. Мені дуже подобалося дивитись мій голос, перекладений словами на екрані. Мій ранній досвід роботи з програмним забезпеченням для розпізнавання мовлення ніде не був приємним.

Що не працює добре

Як я вже згадував, деякі програми просто несумісні з розпізнаванням мови . Я навіть не зміг відкрити Adobe Reader або версію Adobe AIR TweetDeck . Я виявив, що не можу ввійти до свого облікового запису Google за допомогою Internet Explorer, щоб спробувати Google Документи - мовби, не було можливості говорити чи писати свій пароль. Я підозрюю, що це проблема безпеки, яка не дозволяє голосувати паролями там, де хтось чує, але це дратує.

Я міг відкрити iTunes і вибрати пісню для відтворення, але насправді не міг змусити її відтворити. Я міг відкрити Scrivener (мій текстовий процесор на вибір), але "Показати номери" не накладав цифри ні на що, що я хотів використовувати. Я не робив жодного дійсно великого експерименту з моїм улюбленим програмним забезпеченням - це лише декілька, які я спробував. Кожному, хто хоче використовувати розпізнавання мовлення, варто перевірити програми, з якими вони хочуть використовувати, щоб бути впевненим, що це буде сумісно.

Більше посилань та ресурсів

Якщо ви ще не бачили попередніх статей, їх можна знайти тут:

  • Робота з розпізнаванням мови: налаштування та конфігурація
  • Робота з розпізнаванням мови: команди, диктування тексту та перегляд Інтернету
  • Вирішення загальних проблем із розпізнаванням мови

Як не дивно, майже неможливо знайти будь-яку інформацію про розпізнавання мови на веб-сайті Microsoft Answers, не натиснувши посилання з пошуку Google або Bing. Я не зміг отримати жодної відповіді, ввівши в поле пошуку "Розпізнавання мови" , хоча на форумах є кілька запитань про це. Використовуйте це посилання, щоб отримати допомогу з розпізнавання мовлення на веб-сайті Windows: результати пошуку розпізнавання мовлення.

Ось коротка стаття у Вікіпедії, яка розповідає про історію розпізнавання мовлення в Microsoft: Розпізнавання мовлення Windows.

Ось запис у блозі, який дає думки автора щодо порівняння розпізнавання мовлення з Dragon Naturally Speaking: Dragon NaturallySpeaking Versus Windows 7 Voice Recognition.

Згортаючи його

Мені дуже подобалося працювати з розпізнаванням мови та дивуватися вдосконаленням, які були зроблені з часом. Звичайно, це було б досить добре для повсякденного використання, особливо з продуктами Microsoft.

Чи продовжуватиму використовувати розпізнавання мови ? Так, коли я можу. На даний момент мені нічого більш складного не потрібно. Варто було витратити час, необхідний для його тренування, і навчити себе правильно його використовувати.

Розпізнавання мовлення: думки про її сильні та слабкі сторони