Федеральне державне автономне освітній заклад
вищої професійної освіти
"Уральський федеральний університет
імені першого Президента Росії Б. М. Єльцина "
Секція інформатизації бібліотечної справи
Реферат на тему:
Комп'ютерний аналіз тексту
Виконавець: Жданова Юлія Сергіївна,
студентка групи ІТ-47021
Науковий керівник: Гришина С. М., доцент.
Єкатеринбург 2010
Зміст
Введення
Глава 1. Аналіз тексту
Глава 2. Комп'ютерний аналіз тексту
2.1 Поняття комп'ютерного аналізу. Історія розвитку
2.2 Проблеми комп'ютерного аналізу тексту
2.3 Витяг інформації
2.4 Обробка природної мови
Глава 3. Програми для комп'ютерного аналізу тексту
3.1 Машинний переклад
3.2 Лінгвістичне програмне забезпечення
3.3 Програми для комп'ютерного аналізу тексту
Висновок
Бібліографічний список і сайтографія
В
Введення
Комп'ютерний аналіз тексту на природній мові активно розвивається в останні роки багатьма колективами. Доступні сьогодні обчислювальні потужності дозволяють застосовувати для обробки великих масивів документів широкий клас математичних методів, що сприяють ефективному вирішенню завдань пошуку, класифікації, кластерного аналізу, виявлення прихованих закономірностей в даних і ін
На жаль, впровадження математичних методів в обробку тексту відбувається в той час, коли власне лінгвістична складова алгоритмів представлена ​​явно недостатньо, і це не дозволяє досягти високого якості роботи прикладних систем. Стійкий ухил в область статистичних методів аналізу привів до того, що комп'ютерна лінгвістика виявилася незатребуваною. Справді, у всіх відомих російськомовних системах подібного класу з лінгвістичного забезпечення використовується лише морфологічний словник, що дозволяє ототожнювати різні словоформи, тоді як алгоритми синтаксичного аналізу реалізовані виключно в автоматичних перекладачів і викликають безліч нарікань у зв'язку з невисокою точністю.
Мета , яку поставила перед собою автор даної роботи - це з'ясувати, що таке комп'ютерний аналіз тексту.
При цьому необхідно вирішити такі завдання :
- ознайомитися з поняттям аналіз тексту;
- розглянути, що розуміється під комп'ютерним аналізом тексту;
- ознайомитися з історією розвитку комп'ютерного аналізу тексту;
- виявити проблеми комп'ютерного аналізу тексту;
- навести деякі програми, які використовуються при комп'ютерному аналізі тексту.
Глава 1. Аналіз тексту
Аналіз (грец. "analysis" - розкладання) - метод наукового дослідження (пізнання) явищ і процесів, в основі якого лежить вивчення складових частин, елементів досліджуваної системи.
Аналітичні методи широко поширені в соціумі, тому термін "Аналіз" часто сприймається як синонім дослідження взагалі і особливо при вирішенні пізнавальних завдань. Аналізу є складовою частиною будь-якого наукового дослідження, утворюючи, як правило, його першу стадію, коли дослідник виявляє в описі досліджуваного об'єкта його будова, склад, властивості, ознаки тощо Він використовується як метод отримання нових результатів в процесі розумової діяльності людини.
Розумовий аналіз скоюється за допомогою понять і суджень, висловлюються в природних або штучних мовах. Такий аналіз орієнтований на виявлення структури цілого, припускаючи фіксацію його частин і встановлення відносин між ними.
У сучасному суспільстві важливим засобом оформлення, фіксації, збереження, передачі інформації та обміну нею є документи.
Аналіз документів - це метод збору первинних даних, при якому документи використовуються в якості головного джерела інформації; це також сукупність методичних прийомів і процедур, застосовуваних для вилучення інформації із документальних джерел при вивченні процесів і явищ у метою вирішення певних завдань.
Аналіз тексту - процес отримання високоякісної інформації з тексту на природній мові. Як правило, для цього застосовується статистичне навчання на основі шаблонів: вхідний текст розділяється за допомогою шаблонів, потім виробляється обробка отриманих даних.
Аналіз тексту - це процес отримання на природній мові високоякісної інформації з цього тексту. Такий аналіз здійснює практично кожна людина не замислюючись, що він робить саме це. Наприклад, будь-який читач книги аналізує зміст, читаючи її по частинах. У загальному випадку всім, особливо працездатному населенню, постійно доводиться працювати з текстовими та іншими видами документів, явно чи неявно аналізуючи їх зміст та інші компоненти, наприклад, якість виготовлення, форму, розмір і т.д. Таким чином, важливим завданн...