Людина постійно створює все нові способи, щоб зробити своє життя комфортнішим і зручнішим. Це проявляється у всьому — повсякденності, в побуті, роботі. Одним з останніх інноваційних рішень став голосове введення, який активно стали використовувати користувачі по всьому світу.
Що це таке?
Голосовий ввід — це свого роду заміна стандартного вводу з клавіатури. Дані беруться з допомогою мікрофона пристрої, перетворюються і відображаються у вигляді звичайного тексту.
Особливо актуальна ця технологія для людей з обмеженими можливостями або тим, кому постійно доводиться працювати з великими обсягами тексту. Як правило, це копірайтери, письменники, перекладачі.
Засоби для голосового введення
Для розпізнавання мови і перетворення її в текст, використовується спеціальне програмне забезпечення. А серед його лідерів можна відзначити кошти від інтернет-гігантів Google і "Яндекс".
Google
Голосове введення "Гугл" інтегрований практично у всі продукти компанії. Сюди входить пошук, браузер Google Chrome, операційна система Android, Google Docs. Це дуже зручно — навчившись користуватися голосовим уведенням в одній технології, можна з успіхом застосовувати його і в іншій.
"Андроїд"
Голосове введення в цій операційній системі доступний «з коробки» у багатьох версіях. Активувати її можна через меню налаштувань «Мова та клавіатура» або «Мова і введення». Після цього практично у всіх місцях, де є введення тексту, будь то набір SMS або текстовий редактор, з'явиться іконка мікрофона. Натискання на неї запустить процес запису, після закінчення якої системи буде потрібно якийсь час для розпізнавання і повернення результату.
Варто відзначити, що даний функціонал на деяких останніх версіях Android доступний і в режимі оффлайн. Правда, для цього доведеться завантажити невеликий архів для потрібної мови. Ще один важливий момент — якщо користувача не влаштовує штатний голосове введення, завжди можна встановити сторонній.
Google Chrome і Google Docs
Голосове введення на комп'ютері доступний з допомогою браузера Google Chrome. Так само, як і в ОС "Андроїд", при відвідуванні сайту "Гугл", в рядку пошуку можна побачити іконку мікрофона. Вона дозволяє записати звук і виконати пошук потрібного об'єкта в мережі, без введення з клавіатури.
Більш розширена версія використовується в онлайн-сервісі документів Google Docs. Крім набору тексту, тут доступні функції переміщення по ньому, форматування, редагування таблиці. Загалом, все, що можна зробити класичними засобами введення — клавіатурою або мишею.
"Яндекс"
"Яндекс" не володіє таким великим набором платформ, на яких можна було б застосовувати голосове введення. Тому поки він представлений у продуктах "Пошук", "Розмова" та "Перекладач". Також навігатори від "Яндекс" вміють розпізнавати мову і розмовляти з користувачем.
"Пошук" можна зустріти в "Яндекс Браузері". Тут він вбудований за замовчуванням і діє аналогічно Chrome. Заснована технологія власної розробки компанії, яка також доступна і для комерційних потреб у вигляді Speech.Kit. Підключивши його до свого проекту, можна використовувати необмежену кількість запитів для розпізнавання. Однак ця послуга платна.
Інші продукти
Крім засобів голосового введення тексту від інтернет-гігантів, є й інші вільні розробники, які активно розвивають і просувають представлену технологію. Якісь реалізовані у вигляді онлайн-сервісів (наприклад, speechpad.ru, august4u.ru, bestfree.ru), а якісь являють собою повноцінні програми, з можливістю установки на комп'ютер (speechka, realspeaker). Незважаючи на те що ресурсів у вільних розробників трохи менше, їх вирішення працюють нітрохи не гірше. А іноді і зовсім використовують API "Гугл".
Переваги і недоліки
Голосове введення на комп'ютері володіє своїми суттєвими плюсами і мінусами: Це безсумнівно зручно. Руки можуть бути вільні під час роботи, а також підвищується швидкість набору, а разом з цим зростає і продуктивність. В мобільних версіях голосових засобів можна працювати з пристроєм не відриваючись, наприклад, від управління автомобілем. До того ж, програми голосового введення дозволяють відмовитися від використання незручною мініатюрної клавіатури операційної системи, що безсумнівно впливає на якість і швидкість введення.
З мінусів можна відзначити підвищені вимоги до якості мікрофона. Він повинен бути найбільш чутливим. А ще сам алгоритм розпізнавання працює не завжди так, як хотілося б. Сторонні шуми і перешкоди можуть викликати збій, і, як наслідок, помилки в тексті. У будь-якому випадку, його доведеться редагувати після набору. Так що диктувати текст потрібно ретельно і чітко. А це збільшує час набору.
На закінчення
Технологія голосового введення постійно вдосконалюється. Все частіше можна зустріти людей, які розмовляють зі своїм смартфоном, годинами або комп'ютером. Голосове введення активно застосовується в проектуванні та виробництві розумних будинків та інших суміжних рішень на основі взаємодії пристроїв з користувачами. Можливо, надалі технологія прийде до більш досконалого виду, коли почне розпізнавати мову з високим рівнем точності, незалежно від шумів і перешкод.