Обработка неструктурированных текстов
книга

Обработка неструктурированных текстов : поиск, организация и манипулирование

Здесь можно купить книгу "Обработка неструктурированных текстов : поиск, организация и манипулирование" в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.

Автор: Грант Ингерсолл, Томас Мортон, Эндрю Фэррис

Форматы: PDF

Издательство: ДМК Пресс

Год: 2023

Место издания: Москва

ISBN: 978-5-89818-308-0

Страниц: 415

Артикул: 103266

Возрастная маркировка: 16+

Электронная книга
519

Краткая аннотация книги "Обработка неструктурированных текстов"

В книге описаны инструменты и методы обработки неструктурированных текстов. Прочитав ее, вы научитесь пользоваться полнотекстовым поиском, распознавать имена собственные, производить кластеризацию, пометку, извлечение информации и автореферирование. Знакомство с фундаментальными принципами сопровождается изучением реальных применений. Издание предназначено для читателей без подготовки в области математической статистики и обработки естественных языков. Примеры написаны на Java, но сами идеи могут быть реализованы на любом языке программирования.

Содержание книги "Обработка неструктурированных текстов : поиск, организация и манипулирование"


Предисловие
Вступление
Благодарности
Об этой книге
Предполагаемая аудитория
Структура книги
Автор в сети
Об иллюстрации на обложке
Глава 1. Готовимся к приручению текста
1.1. Почему так важна задача обработки текста
1.2. Предварительный обзор фактографической вопросно-ответной системы
1.3. Понять смысл текста трудно
1.4. Прирученный текст
1.5. Текст и интеллектуальные приложения: поиск и не только
1.6. Резюме
1.7. Ресурсы
Глава 2. Основы приручения текста
2.1. Основы лингвистики
2.2. Популярные инструменты для обработки текста
2.3. Предобработка и выделение содержимого из файлов в распространенных форматах
2.4. Резюме
2.5. Ресурсы
Глава 3. Поиск
3.1. Пример фасетного поиска: Amazon.com
3.2. Введение в концепции поиска
3.3. Введение в поисковый сервер Apache Solr
3.4. Индексирование содержимого с помощью Apache Solr
3.5. Поиск по содержимому в Apache Solr
3.6. Факторы, влияющие на производительность поиска
3.7. Повышение производительности поиска
3.8. Альтернативные поисковые системы
3.9. Резюме
3.10. Ресурсы
Глава 4. Неточное сравнение строк
4.1. Различные подходы к неточному сравнению строк
4.2. Нахождение строк, неточно совпадающих с данной
4.3. Использование неточного сравнения строк в приложениях
4.4. Резюме
4.5. Ресурсы
Глава 5. Распознавание имен людей, географических названий и других сущностей
5.1. Различные подходы к распознаванию именованных сущностей
5.2. Основы распознавания сущностей в OpenNLP
5.3. Подробнее о распознавании сущностей в OpenNLP
5.4. Качество работы OpenNLP
5.5. Настройка OpenNLP для распознавания сущностей в новой предметной области
5.6. Резюме
5.7. Ресурсы
Глава 6. Кластеризация текста
6.1. Кластеризация документов в Google News
6.2. Основы кластеризации
6.3. Подготовка к созданию простого приложения кластеризации
6.4. Кластеризация результатов поиска с помощью Carrot2
6.5. Кластеризация наборов документов с помощью Apache Mahout
6.6. Тематическое моделирование с помощью Apache Mahout
6.7. Качество кластеризации
6.8. Благодарности
6.9. Резюме
6.10. Ресурсы
Глава 7. Классификация, категоризация и пометка
7.1. Введение в классификацию и категоризацию
7.2. Процесс классификации
7.3. Построение классификаторов документов с помощью Apache Lucene
7.4. Обучение наивного байесовского классификатора в Apache Mahout
7.5. Классификация документов с помощью OpenNLP
7.6. Построение рекомендателя меток с помощью Apache Solr
7.7. Резюме
7.8. Ресурсы
Глава 8. Пример вопросно-ответной системы
8.1. Основы вопросно-ответной системы
8.2. Установка и запуск QA-системы
8.3. Архитектура демонстрационной вопросно-ответной системы
8.4. Установление смысла вопроса и порождение ответов
8.5. Усовершенствование системы
8.6. Резюме
8.7. Ресурсы
Глава 9. Неприрученный текст: на переднем крае
9.1. Семантика, дискурс и прагматика: высшие уровни NLP
9.2. Реферирование документов и наборов документов
9.3. Извлечение отношений
9.4. Выявление важного содержимого и людей
9.5. Распознавание эмоций с помощью анализа тональности
9.6. Межъязыковой информационный поиск
9.7. Резюме
9.8. Ресурсы
Предметный указатель

Все отзывы о книге Обработка неструктурированных текстов : поиск, организация и манипулирование

Чтобы оставить отзыв, зарегистрируйтесь или войдите

Внимание!
При обнаружении неточностей или ошибок в описании книги "Обработка неструктурированных текстов : поиск, организация и манипулирование (автор Грант Ингерсолл, Томас Мортон, Эндрю Фэррис)", просим Вас отправить сообщение на почту help@directmedia.ru. Благодарим!