«Відкрите Суспільство» (фонд Джорджа Сороса). У нашому випадку програма Word Tabulator буде використовуватися для порівняння нашого вихідного тексту з еталонними текстами, тобто текстами мають загальнолітературний характер. Це робитиметься для отримання стека ключових слів - слів відображають спеціалізацію даного тексту. Обсяги порівняння текстів будуть великими, тому необхідна програма справляється з великим обсягом вхідної інформації за короткий період часу.
середу - Microsoft Excel Visual Basic for Applications (VBA, Visual Basic для додатків) - спрощена реалізація мови програмування Visual Basic, вбудована в лінійку продуктів Microsoft Office (включаючи версії для Mac OS), а також в багато інші програмні пакети, такі як AutoCAD, Solid Works, CorelDraw, WordPerfect і ESRI ArcGIS. VBA покриває і розширює функціональність раніше використовувалися спеціалізованих макромов, таких як WordBasic.Basic вважається засобом швидкої розробки прототипів програми, для розробки додатків баз даних і взагалі для компонентного способу створення програм, що працюють під управлінням операційних систем сімейства Microsoft Windows.
На даному мовою створений модуль сортування ключових слів у групи, за принципом їх взаємозамінності в майбутньому тесті. Microsoft Excel обраний через зручного інтерфейсу у вигляді електронної таблиці, і можливості простої реалізації угруповання за допомогою VBA.
Останньою середовищем обробки матеріалів є вбудована мова програмування 1С: Підприємство, який використовується в сімействі програм 1С: Підприємство. Дана мова є попередньо компільовані предметно-орієнтованою мовою високого рівня. Середовищем виконання мови є програмна платформа 1С: Підприємство. Візуальне середовище розробки (Конфігуратор) є невід'ємною частиною пакету програм 1С: Підприємство. Діалекти мови для платформ 1С 7 версій (7.0, 7.5, 7.7) сумісні знизу вгору з незначними винятками. Мови для платформ 1С: 7х і 1С: 8х сумісні за основним операторам, але значно відрізняються в роботі з прикладними об'єктами, внаслідок чого перенесення коду з 1С: 7х в 1С: 8х не має сенсу. Вбудована мова 1С: 8 найбільш подібний за своїм синтаксису мови Visual Basic. Мова 1С використовується нами для складання остаточних тестів і зручний своєю можливістю використання документів Microsoft Excel для вивантаження і завантаження інформації, а також складання внутрішніх таблиць для зберігання даних. До того ж швидка робота додатків написаних на 1С, гарантує високу продуктивність і мінімальні витрати часу.
4.2 Отримання стека ключових слів
Для автоматичного вилучення спеціальних термінів слід використовувати різницю частот слів і фраз у текстах обраної вузької спеціальності на тлі текстів більш широких областей («віднімання частот», «контрастний метод»). На думку більшості експертів, що працюють у сфері розробки інтелектуальних додатків аналізу текстів, цей спосіб виділення термінів ефективний при обробці загальноприйнятих в обраній галузі науки джерел. Тому фонові тексти повинні включати досить великі корпуси як загальнонаукових, так і загальнолітературних текстів. Фактично процедура обробки починається з видалення всіх загальнолітературних слів (словоформ) з установленого тексту. Наслідком даної процедури ми отримуємо список спеціальних слів оброблюваного тексту, надалі будемо називати їх ключовими словами, які і будуть якої...