це у фільтрації є одне обмеження, це те, що зображення може швидко псується, тому що число пар збільшується.
Наприклад, в Consed іноді бажано відключати зображення всіх узгоджених пар внутрішнього набору генів зчитування, так як їх кількість перевантажує зображення.
У доповненні до однієї з пар послідовності схожість може бути використано для виявлення всіляких генів зчитування і для перевірки виходу В«вікно порівняння наборів генів зчитування В». Аналогічні функції існують і в інших обробних програмах забезпечення, наприклад Gap4 приєднаний редактор наборів генів зчитування. Ці надані послідовності доповнюють огляд показують, як Gap4 використовує точкові графіки, що зображують кожну з осей, які вказують на позиції вздовж довжини наборів генів зчитування, і розділяє точки в місцях сумісності вище меж подібної послідовності.
Користувач може інтерактивно досліджувати послідовність взаємозв'язку між різними наборами генів зчитування і переглядати результати пошукових операцій, таких як В«знайти, повторВ». Збори зображень Consed може відображати вихід утиліта порівняння званого В«пара хрестівВ», використовуючи для цього зв'язування областей з подібної послідовністю між користувачем наборів генів зчитування
Різні кольори означають такі функції як напрям повторюються з інтернованих повторів. Одним з переваг перегляду подібності послідовностей в збірці зображення є можливість інтегрування зчитування ділянок, які можуть виявляти несподівано високі регіони дії і часто вказують на аналогічні послідовності, які були помилково зруйновані і зібрані у одну. Користувач може вибрати для вивчення послідовності подібності на основному рівні, і знову натискаючи, вивчає, те, що лежить в основі повідомлення. Існують також автономні інструменти функцій, пов'язані наприклад до Miropeats, широко використовувані для ранніх геномних проектів секвенування.
UNIXC - оболонки, які генерують статистичні картинки з використанням дугових зображень для позначення різних повторів.
Наступне покоління засобів зображення послідовностей
Індивідуальне секвенування геномів стало можливим і поклало початок геномному проекту 1,000. Ці дані дають безпрецедентну можливість для характеристики видів людських генотипів, а також дають нове покоління обчислювальних методів з появою результату обчислення.
У деяких випадках візуальна інспекція може сприяти оцінки та інтерпретації зчитування узгоджених методів і генетичної мінливості виявлення виведення даних.
Асемблювання зображує кошти володіють необхідними функціями, але побудованими за даними Сенгер і спочатку істотно краще прочитуючим обьем технологій NGS. Деякі з цих коштів у Нині модернізовані, для вирішення складніших наборів даних існує Consed і оновлена ​​Gap5, також розроблена нова хвиля інструментів з урахуванням цілей.
Наприклад, Eagle View, Map View, IGV (таблиця 1). На відміну від програмного забезпечення ці кошти, в першу чергу дані програм перегляду не надають функції редагування. Через їх акценту на перегляді багато програми забезпечують більш гнучкі можливості, а масштабування дозволяє користувачеві вільно зменшувати зображення. Наявна у продажу КМО геноміка Workbench є особливо зручною для користувача і включає в себе власне зчитування узгоджених програм, які можуть бути запущені через GUL.
У контексті рессеквенціі одна з пар дає цінну інформацію про структурні зміни, таких як вставка, видалення та інверсії. Як вже говорилося, в попередньому розділі одна з пар може, вказувати на неправильну збірку і користувачі можуть виконувати виявлення змін за проектом асемблювання і інформувати про ці проблемах.
LookSeq і Gap5 використовують вертикальну вісь обертання і вказують розмір вставки. Це розділяє одну з пар несумісності на окремі ділянки і візуально відокремлює великі розміри вставок, які припускають включення результатів. При аналізі структурних змін, важливо розглядати анотацію генів, наприклад, чи приводять зміни до синонімів або нонсенсам в амінокислотах.
З цієї причини деякі з візуалізуючих засобів і деякі закінчені програми забезпечення допомагають поясненням процесів на дисплеї.
Consed служить прикладом на дисплеї узгодженої трансляції амінокислот у всіх шести зчитування фреймах і дозволяє користувачеві анотувати генотипи, повтори і визначати гени.
Проблеми NGS і великий обсяг даних, створюють обчислювальні та представницькі проблеми. Нові формати файлів на приклад вирівнювання послідовності (карти SAM) формати, прийняті в 1,000 геномної проекті, а також компактні формати вирівнювання. CALF забезпечує компактне зберігання даних зчитування вирівнювань.
Прединдексанція, наприклад файлів ВАМ (супутник бінарне представлення SAM) - все ширше використовується для досягнення швидкого пошуку, випадково узгоджених даних і зменшує вимоги до пам'яті інтерактивних вирівнювань. Наприклад, більшість зчитуван...