Введение в определение обработки естественного языка (NLP)
Что такое обработка естественного языка (NLP)?
Обработка естественного языка (NLP) - это область искусственного интеллекта (AI), которая позволяет компьютерам анализировать и понимать человеческий язык, как письменный, так и устный. Он был разработан для создания программного обеспечения, которое генерирует и понимает естественные языки, чтобы пользователь мог иметь естественный диалог с компьютером вместо программирования или искусственных языков, таких как Java или С.
Ключевые выводы
- Обработка естественного языка (NLP) использует компьютерные алгоритмы и искусственный интеллект, чтобы компьютеры могли распознавать человеческое общение и реагировать на него.
- Хотя существует несколько методов НЛП, они обычно включают разбиение речи или текста на дискретные части, а затем сравнение их с базой данных о том, как эти единицы сочетаются друг с другом на основе прошлого опыта.
- Приложения для преобразования текста в речь, которые теперь можно найти на большинстве платформ iOS и Android, а также интеллектуальные колонки. такие как Amazon Echo (Alexa) или Google Home, стали повсеместными примерами НЛП за последние несколько годы.
Понимание обработки естественного языка (NLP)
Обработка естественного языка (NLP) - это один шаг в более крупной миссии технологического сектора, а именно: использование искусственный интеллект (AI), чтобы упростить работу мира. Цифровой мир изменил правила игры для многих компаний, поскольку все более технологически подкованное население находит новые способы онлайн-взаимодействия друг с другом и с компаниями.
Социальные сети изменили понятие сообщества; криптовалюта изменил норму цифровых платежей; электронная коммерция создала новое значение слова «удобство», а облачное хранилище предоставило массам еще один уровень хранения данных.
Через ИИ такие поля, как машинное обучение и глубокое обучение открывают глаза на мир всех возможностей. Машинное обучение все чаще используется в аналитике данных, чтобы понять большие данные. Он также используется для программирования чат-ботов для имитации человеческих разговоров с клиентами. Однако эти перспективные приложения машинного обучения были бы невозможны без импровизации обработки естественного языка (NLP).
Этапы обработки естественного языка (НЛП)
НЛП сочетает искусственный интеллект с компьютерной лингвистикой и информатикой для обработки человеческих или естественных языков и речи. Процесс можно разбить на три части. Первая задача НЛП - понять естественный язык, полученный компьютером. Компьютер использует встроенную статистическую модель для выполнения процедуры распознавания речи, которая преобразует естественный язык в язык программирования. Он делает это, разбивая недавнюю речь, которую он слышит, на крошечные единицы, а затем сравнивает эти единицы с предыдущими единицами из предыдущей речи.
Вывод или результат в текстовом формате статистически определяет наиболее вероятные слова и предложения. Эта первая задача называется преобразованием речи в текст.
Следующая задача называется тегированием части речи (POS) или устранением неоднозначности категории слов. Этот процесс элементарно идентифицирует слова в их грамматических формах как существительные, глаголы, прилагательные, прошедшее время и т. Д. используя набор правил лексики, закодированных в компьютере. После этих двух процессов компьютер, вероятно, теперь понимает значение произнесенной речи.
Третий шаг, сделанный НЛП, - преобразование текста в речь. На этом этапе язык компьютерного программирования преобразуется в звуковой или текстовый формат для пользователя. Например, чат-бот для финансовых новостей, которому задают вопрос типа "Как дела у Google сегодня?" скорее всего будет сканировать финансовые сайты в Интернете на наличие акций Google и может принять решение выбрать только такую информацию, как цена и объем, в качестве Ответить.
Особые соображения
НЛП пытается сделать компьютеры разумными, заставляя людей поверить в то, что они взаимодействуют с другим человеком. Тест Тьюринга, предложенный Аланом Тьюрингом в 1950 году, утверждает, что компьютер может быть полностью интеллектуальным, если он может мыслить и вести разговор, как человеческий, без того, чтобы человек знал, что он на самом деле разговаривает с машина.
Один компьютер в 2014 году попросту прошел тест - чат-бот с изображением 13-летнего мальчика. Это не означает, что интеллектуальную машину невозможно построить, но он описывает трудности, связанные с тем, чтобы заставить компьютер думать или разговаривать как человек. Поскольку слова могут использоваться в разных контекстах, а машины не имеют реального жизненного опыта, который есть у людей для передачи и описывая сущности словами, может пройти немного больше времени, прежде чем мир сможет полностью покончить с компьютерным программированием язык.
Возможно, наиболее распространенное использование НЛП сегодня - преобразование текста в речь, которое можно найти во многих мобильных операционных системах или интеллектуальных динамиках. Действительно, к 2021 году технология умных динамиков полностью проникла на рынок США, где более одной трети домохозяйств в настоящее время используют такие устройства, как Amazon Echo (Alexa) или Google Nest.