Теми рефератів
> Реферати > Курсові роботи > Звіти з практики > Курсові проекти > Питання та відповіді > Ессе > Доклади > Учбові матеріали > Контрольні роботи > Методички > Лекції > Твори > Підручники > Статті Контакти
Реферати, твори, дипломи, практика » Новые рефераты » Комп'ютерний аналіз тексту

Реферат Комп'ютерний аналіз тексту





стема CuneiForm була розроблена компанією Cognitive Technologies як комерційний продукт. CuneiForm поставлявся з деякими моделями сканерів. Проте після кількох років перерви розробки, 12 грудня 2007 анонсовано відкриття вихідних текстів програми, яке відбулося 2 квітня 2008 року.

Особливості. CuneiForm позиціонується як система перетворення електронних копій паперових документів і графічних файлів у редагований вигляд з можливістю збереження структури і гарнітури шрифтів оригінального документа в автоматичному чи напівавтоматичному режимі. Система включає в себе дві програми для одиночної і пакетної обробки електронних документів. CuneiForm - Шріфтонезавісімая система. p> В) Tesseract - вільна програма для розпізнавання текстів, що розроблялася Hewlett-Packard з середини 1980-х по середину 1990-х, а потім 10 років "пролежала на полиці". Не так давно (у серпні 2006 р) Google купив її і відкрив вихідні тексти під ліцензією Apache 2.0 для продовження розробки. На даний момент програма вже працює з UTF-8, підтримка мов (включаючи, російську з версії 3.0) здійснюється за допомогою додаткових модулів.

Г) OCRopus - OCR-система на базі не так давно відкритого розпізнає ядра - tesseract Програмний пакет для розпізнавання тексту, що розвивається за принципами Open Source і розповсюджується під Apache License 2.0. За задумом розробників, за допомогою OCRopus стане можливим визначати текстовий вміст на цифрових зображеннях і переводити його в звичайний текстовий формат для подальшого редагування. Крім друкованого тексту, програма зможе розпізнавати і рукописні матеріали. Станом на альфа-реліз, OCRopus використовує мова моделювання код з іншого проекту підтримуваного Google OpenFST. OCRopus в даний час доступна тільки для GNU/Linux, але існують збірки і для Debian GNU/Hurd і Debian GNU/kFreeBSD. p> Використання. В даний час OCRopus використовує тільки інтерфейс командного рядка, приймаючи вказівки на вхідні зображення з текстом, і виводячи дані у форматі hOCR (відкритий формат на основі HTML). Якщо необхідний більш точний контроль, можна вказати в командному рядку команди для виконання конкретних операцій (наприклад, розпізнання одного рядка).


Висновок


Підводячи підсумки можна сказати, що комп'ютерний аналіз тексту є значущим прийомом вивчення специфіки текстового втілення концептуальної картини світу, що дозволяє осягнути особливості стилю.

У ході роботи були отримані наступні результати:

1. Виявлено, що тема комп'ютерного аналізу тексту не вельми вивчена, так як немає конкретного визначення.

2. З глави 2, подглави 2.2 "Проблеми комп'ютерного аналізу тексту "видно, що проблем у розробці комп'ютерного аналізу дуже багато. Вони, звичайно, вирішуються, але не всі і в уповільненому темпі.

3. З глави 3 "Програми для комп'ютерного аналізу тексту "також видно, яке різноманітність комп'ютерних програм, які зчитують інформацію і дозволяють здійснити аналіз тексту на комп'ютері.

Отримані дані є відносно новими в сфері дослідження аналізу текстів на комп'ютерному мовою, тому що являють собою спробу структурувати наявні знання в даній сфері і синтезувати їх з новими. Переваги комп'ютерного аналізу перед аналогічним дослідженням тестів в ручну, на мій погляд, очевидні. Він дозволяє заощадити час на структуруванні результатів, оформленні їх у таблицях, графіках, визначеннях.

Таким чином, тема "Комп'ютерний аналіз тексту" вельми цікава при вивченні, і не до кінця розглянута авторами багатьох робіт. Немає певного поняття комп'ютерному аналізу тексту, немає єдиного документа, де був би зібраний, структурований матеріал по заданій темі. Труднощі були в тому, щоб відібрати необхідні дані, виділити в них головні особливості, а також зробити відібраний матеріал доступним, зрозумілим для користувача.

комп'ютерний текст орфографія переклад

Бібліографічний список і сайтографія


1. Аналіз документів [Електронний ресурс]. - Режим доступу: # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#">

17. П'ятницька, Анастасія Сергіївна. Програма для пошуку фактів у тексті RCO Fact Extractor 1.0 [Електронний ресурс]/А. С. П'ятницька. - Режим доступу: 18. Романова, Т. В. Про зміст поняття концептуальний аналіз тексту [Текст]/Т. В. Романова// Вісник Оренбурзького державного університету. - 2004. - N 1. - С. 20-24. p> Розміщено на


Назад | сторінка 9 з 9





Схожі реферати:

  • Реферат на тему: Розвиток творчого мислення учнів на заняттях комп'ютерного практикуму в ...
  • Реферат на тему: Програма для визначення встановленого комп'ютерного обладнання
  • Реферат на тему: Комп'ютерний тренажер-емулятор персонального комп'ютера "AMD A ...
  • Реферат на тему: Програмна система комп'ютерного клубу
  • Реферат на тему: Інформаційна система комп'ютерного магазину