стема CuneiForm була розроблена компанією Cognitive Technologies як комерційний продукт. CuneiForm поставлявся з деякими моделями сканерів. Проте після кількох років перерви розробки, 12 грудня 2007 анонсовано відкриття вихідних текстів програми, яке відбулося 2 квітня 2008 року.
Особливості. CuneiForm позиціонується як система перетворення електронних копій паперових документів і графічних файлів у редагований вигляд з можливістю збереження структури і гарнітури шрифтів оригінального документа в автоматичному чи напівавтоматичному режимі. Система включає в себе дві програми для одиночної і пакетної обробки електронних документів. CuneiForm - Шріфтонезавісімая система. p> В) Tesseract - вільна програма для розпізнавання текстів, що розроблялася Hewlett-Packard з середини 1980-х по середину 1990-х, а потім 10 років "пролежала на полиці". Не так давно (у серпні 2006 р) Google купив її і відкрив вихідні тексти під ліцензією Apache 2.0 для продовження розробки. На даний момент програма вже працює з UTF-8, підтримка мов (включаючи, російську з версії 3.0) здійснюється за допомогою додаткових модулів.
Г) OCRopus - OCR-система на базі не так давно відкритого розпізнає ядра - tesseract Програмний пакет для розпізнавання тексту, що розвивається за принципами Open Source і розповсюджується під Apache License 2.0. За задумом розробників, за допомогою OCRopus стане можливим визначати текстовий вміст на цифрових зображеннях і переводити його в звичайний текстовий формат для подальшого редагування. Крім друкованого тексту, програма зможе розпізнавати і рукописні матеріали. Станом на альфа-реліз, OCRopus використовує мова моделювання код з іншого проекту підтримуваного Google OpenFST. OCRopus в даний час доступна тільки для GNU/Linux, але існують збірки і для Debian GNU/Hurd і Debian GNU/kFreeBSD. p> Використання. В даний час OCRopus використовує тільки інтерфейс командного рядка, приймаючи вказівки на вхідні зображення з текстом, і виводячи дані у форматі hOCR (відкритий формат на основі HTML). Якщо необхідний більш точний контроль, можна вказати в командному рядку команди для виконання конкретних операцій (наприклад, розпізнання одного рядка).
Висновок
Підводячи підсумки можна сказати, що комп'ютерний аналіз тексту є значущим прийомом вивчення специфіки текстового втілення концептуальної картини світу, що дозволяє осягнути особливості стилю.
У ході роботи були отримані наступні результати:
1. Виявлено, що тема комп'ютерного аналізу тексту не вельми вивчена, так як немає конкретного визначення.
2. З глави 2, подглави 2.2 "Проблеми комп'ютерного аналізу тексту "видно, що проблем у розробці комп'ютерного аналізу дуже багато. Вони, звичайно, вирішуються, але не всі і в уповільненому темпі.
3. З глави 3 "Програми для комп'ютерного аналізу тексту "також видно, яке різноманітність комп'ютерних програм, які зчитують інформацію і дозволяють здійснити аналіз тексту на комп'ютері.
Отримані дані є відносно новими в сфері дослідження аналізу текстів на комп'ютерному мовою, тому що являють собою спробу структурувати наявні знання в даній сфері і синтезувати їх з новими. Переваги комп'ютерного аналізу перед аналогічним дослідженням тестів в ручну, на мій погляд, очевидні. Він дозволяє заощадити час на структуруванні результатів, оформленні їх у таблицях, графіках, визначеннях.
Таким чином, тема "Комп'ютерний аналіз тексту" вельми цікава при вивченні, і не до кінця розглянута авторами багатьох робіт. Немає певного поняття комп'ютерному аналізу тексту, немає єдиного документа, де був би зібраний, структурований матеріал по заданій темі. Труднощі були в тому, щоб відібрати необхідні дані, виділити в них головні особливості, а також зробити відібраний матеріал доступним, зрозумілим для користувача.
комп'ютерний текст орфографія переклад
Бібліографічний список і сайтографія
1. Аналіз документів [Електронний ресурс]. - Режим доступу: # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#"> # "#">
17. П'ятницька, Анастасія Сергіївна. Програма для пошуку фактів у тексті RCO Fact Extractor 1.0 [Електронний ресурс]/А. С. П'ятницька. - Режим доступу: 18. Романова, Т. В. Про зміст поняття концептуальний аналіз тексту [Текст]/Т. В. Романова// Вісник Оренбурзького державного університету. - 2004. - N 1. - С. 20-24. p> Розміщено на