ачень - істина (true), брехня (false) і пусте значення (null).
Подальші кроки майстра імпорту будуть залежати від того, який об'єкт дерева категорій був обраний аналітиком (рис. 6, д). Виконуючи рекомендації у відкритому вікні, послідовно вибираємо необхідний для аналізу файл в текстовому форматі. Потім вибираємо необхідний формат даних і переходимо до завдання роздільників, призначаючи їх з переліку. В якості роздільників, представлень значень і форматів за замовчуванням завжди пропонуються системні налаштування операційної системи. Тому при імпорті необхідно звертати увагу на їх відповідність формату в імпортованому текстовому файлі. Наступне вікно майстра залежить від встановленого перемикача в прапорці Формат вихідних даних. Якщо був обраний формат з роздільниками, то з'явиться вкладка, на якій потрібно явно вказати символ-роздільник (за замовчуванням - табуляція). Тут же знаходиться прапор Вважати послідовні роздільники одним - у разі послідовно йдуть символів-роздільників вони будуть сприйматися за один. Таке буває, наприклад, коли символом-роздільником виступають кілька пробілів. Поперед перегляд текстового файлу у вигляді таблиці внизу (завантажуються тільки перші 10 рядків) дозволяє переконатися в коректності вибору налаштувань імпорту, навіть не запускаючи його. Якщо був обраний прапор Формат фіксованої ширини, то з'явиться вкладка, на якій потрібно задати межі кожного поля. Створення, як і видалення маркера кордону, провадиться одним клацанням миші. Рухаючи маркери кордонів стовпців, можна змінювати їх, якщо вони розставлені неправильно. Дані, розподілені по стовпцях, показуються в області попереднього перегляду. На кроці Налаштування параметрів стовпців потрібно налаштувати наступні параметри стовпців, імпортованих даних, вказавши відповідні значення в полях.
Ім'я стовпця - вказується ім'я, яке буде служити ідентифікатором стовпця в подальших вузлах. За умовчанням пропонується заголовок стовпчика з текстового файлу, якщо на попередньому кроці був встановлений прапорець Перший рядок є заголовком. Інакше будуть запропоновані імена типу COL1, COL2 і т. Д. Можна ввести будь-які імена, які семантично відображають вміст стовпця, проте допускаються тільки латинські символи, і ім'я шпальти має бути унікальним в межах всіх стовпців імпортованого файлу.
Мітка стовпця - назва, під яким даний стовпець буде видно в візуалізаторах. Допускаються будь-які символи, унікальність імен не обов'язкова. Тип даних - вказується тип даних, що містяться в стовпці. Тип вибирається зі списку, що відкривається клацанням по кнопці в правій частині поля? Доступні типи даних представлені в таблиці 2.
Таблиця 2
Типи даних в платформі Deductor
Тип ОпісаніеЛогіческій дата/час речовинний цілий строковийданние в полі можуть приймати тільки два значення - 0 або 1 поле містить дані типу дата/час числа з плаваючою точкою цілі числа рядка символів
Вузол імпорту завжди намагається автоматично розпізнати тип даних по першому рядку файлу (якщо є заголовки, то по другому рядку). Такий алгоритм спрацьовує не завжди.
Безперервними можуть бути тільки числові дані. Дискретний характер носять, як правило, строкові дані, але не завжди.
Дискретними можуть бути призначені в залежності від контексту розв'язуваної задачі дані цілого типу, рідше - речового. Вид даних стовпця впливає на:
алгоритм розрахунку статистики по стовпцю;
роботу аналітичних алгоритмів.
Призначення - визначає порядок використання поля набору даних, отриманого в результаті імпорту стовпця (поля) при подальшій обробці імпортованих даних, приклади призначень представлені в таблиці 3.
Таблиця 3.
Призначення полів в платформі Deductor
Змінити призначення групи стовпців однією операцією можна наступним чином:
утримуючи клавішу Shift, виділити мишкою або клавішами Ctrl + ?, Ctrl +? перший і останній стовпці групи стовпців і змінити їх призначення;
утримуючи клавішу Ctrl, виділити мишею тільки потрібні стовпці і змінити їх призначення.
На кроці Запуск процесу імпорту стартує сам процес імпорту даних з раніше налаштованими параметрами. Хід процесу імпорту відображається за допомогою індикатора. Якщо процес імпорту зупинився, це сигналізує про можливих помилок при читанні даних. У цьому випадку з'являється вікно з повідомленням про помилку.
У разі виникнення помилок невідповідності типів процес імпорту буде продовжений, але після його закінчення буде відображений журнал реєстрації помилок з інформацією про місце і причини їх появи. Дл...