Обработка естественного языка на Java
книга

Обработка естественного языка на Java : исследование разных подходов к организации и извлечению полезной текстовой информации из неструктурированных данных с использованием Java

Здесь можно купить книгу "Обработка естественного языка на Java : исследование разных подходов к организации и извлечению полезной текстовой информации из неструктурированных данных с использованием Java" в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.

Автор: Ричард Риз

Форматы: PDF

Издательство: ДМК Пресс

Год: 2023

Место издания: Москва

ISBN: 978-5-89818-333-2

Страниц: 265

Артикул: 103304

Возрастная маркировка: 16+

Электронная книга
559

Краткая аннотация книги "Обработка естественного языка на Java"

Обработка естественного языка (Natural Language Procession — NLP) представляет собой важную область разработки прикладного ПО и, с учетом современных задач ИТ, в будущем эта важность будет только возрастать. Уже сейчас наблюдается рост потребности в приложениях, работающих с естественными языками на основе NLP-методик. В данной книге рассматриваются способы организации автоматической обработки текста с применением таких методик, как полнотекстовый поиск, правильное распознавание имен, кластеризация, классификация, извлечение информации и составление аннотаций. Концепции обработки естественного языка излагаются таким образом, что даже читатели, не обладающие знаниями об этой технологии и о методах статистического анализа, смогут понять их.

Содержание книги "Обработка естественного языка на Java : исследование разных подходов к организации и извлечению полезной текстовой информации из неструктурированных данных с использованием Java"


Об авторе
О рецензентах
Предисловие
Глава 1. Основы обработки естественного языка
Что такое обработка естественного языка
Для чего используется обработка естественного языка
Трудности обработки естественного языка
Обзор инструментальных средств обработки естественного языка
Обзор задач обработки текста
О моделях обработки естественного языка
Резюме
Глава 2. Поиск фрагментов текста
Части или фрагменты текста
Что такое токенизация
Простые токенизаторы языка Java
Прикладные программные интерфейсы NLP для токенизации
Нормализация
Резюме
Глава 3. Поиск предложений
Процесс разрешения границ предложений
Затруднения при разрешении границ предложений
Правила разрешения границ предложений в классе HeuristicSentenceModel библиотеки LingPipe
Простые средства разрешения границ предложений в языке Java
Использование библиотек NLP API
Обучение модели SentenceDetector
Резюме
Глава 4. Поиск людей и именованных объектов
Трудности, возникающие при распознавании и идентификации именованных объектов
Методики распознавания именованных объектов
Использование регулярных выражений для распознавания и идентификации именованных объектов
Использование библиотек NLP
Обучение модели
Оценка характеристик модели
Резюме
Глава 5. Определение частей речи
Процесс разметки
Использование библиотек NLP API
Резюме
Глава 6. Классификация текстов и документов
Как используется классификация текста
Особенности анализа эмоциональной окраски текста
Методики классификации текста
Использование библиотек NLP API для классификации текста
Резюме
Глава 7. Использование синтаксического анализатора (парсера) для выделения взаимосвязей
Типы взаимосвязей
Деревья синтаксического анализа
Использование полученных взаимосвязей
Извлечение взаимосвязей из текста
Использование библиотек NLP API
Извлечение взаимосвязей для системы «вопрос–ответ»
Резюме
Глава 8. Комплексные методики
Подготовка данных
Конвейеры
Создание конвейера для текстового поиска
Резюме
Предметный указатель

Все отзывы о книге Обработка естественного языка на Java : исследование разных подходов к организации и извлечению полезной текстовой информации из неструктурированных данных с использованием Java

Чтобы оставить отзыв, зарегистрируйтесь или войдите

Внимание!
При обнаружении неточностей или ошибок в описании книги "Обработка естественного языка на Java : исследование разных подходов к организации и извлечению полезной текстовой информации из неструктурированных данных с использованием Java (автор Ричард Риз)", просим Вас отправить сообщение на почту help@directmedia.ru. Благодарим!