Візуалізація генів: методи і проблеми
Оскільки наші здібності генерування послідовностей даних продовжують рости, аналіз даних, генерування даних є лімітуючою стадією в галузі геноміки.
Тут ми пропонуємо посібник з візуалізації даних, геномні кошти, які полегшують аналізування завдань і дозволяють досліджувати, вивчати, тлумачити і керувати своїми даними, а в деяких випадках виконувати обчислення миттєво. Ми будемо обговорювати графічні методи, призначені для аналізу de novo послідовностей і зчитування вирівнювання, геномного перегляду в майбутньому. Вивчення геномів в значній ступеня дозволило говорити про геноміки, як про цифровий науки, і зробило можливим з появою технології секвенування, виявляти геномні послідовності для нуклеотидного аналізу. Поява обширних даних про геномної послідовності ресурсів відкрило новий інтерфейс комп'ютерної науки, яка використовується в таких областях як біоінформатика і надає можливості вирішення біологічних задач за допомогою обчислень. Останні інновації в галузі технології секвенування забезпечують безпрецедентну здатність для генерації даних. Зараз більш ніж коли-небудь нам необхідні інтуїтивні та оперативні дані досліджень для аналізу.
Хоча безліч геномних аналізів для даних завдань можуть бути виконані за допомогою автоматичних процесів, але деякі дії ще як і раніше вимагають людських суджень і часто з обмеженою швидкістю. Візуалізація може посилити наші здібності міркувати про складність даних, тим самим підвищуючи ефективність ручного аналізу.
У деяких випадках, відповідне зображення дає очевидне рішення.
Враховуючи важливість людських інтерпретацій особливо на ранніх етапах гіпотези поколінь біологічних досліджень, візуальні засоби можуть також стати цінним доповненням до автоматизованим обчислювальним методам і дозволяють отримувати нам наукове розуміння про великих геномних наборах даних. Візуальні та автоматизовані підходи є особливо потужним засобом, коли використовуються в поєднанні, наприклад, користувач може легко контролювати і проводити розрахунки за цими даними, багаторазово їх, уточнюючи і аналізуючи.
Одна з проблем при розробки візуальних засобів полягає в ухваленні рішення графічного подання по суті, тобто як дані кодуються за кольорами, формою або перетворені на різних рівнях. Вибір подання може або допомагати, або заважати можливостям для користувачів до інтерпретації даних і в ідеалі повинен бути розроблений так, щоб полегшити аналіз завдання. Наприклад, перебудову генома можна більш легко уявити як дуги на колі, ніж на лінії. Геномні дані, взяті, з різних джерел при використанні різних методів супроводжуються експериментальними похибками. Важливо, що візуально представлені і зафіксовані ці технічні невизначеності і будь-які невідповідності.
Існує також значне біологічне відмінність між індивідуумами, які необхідно відрізняти від технічних змін описаних вище. До доповнення до завдань вибору відповідного візуального представлення, деякі види первинних даних не представлені через надмірні вимоги зберігання в мережі і дозволяють у режимі реального часу взаємодіяти з великими наборами даних, які є нетривіальними.
Цей огляд призводить приклади трьох основних користувача завдань: 1) аналіз послідовності даних, як у контексті збірки заново і рессеквенірованіе експериментів; 2) перегляд анотацій і зіставлення експериментальних даних з посиланням геномів, і нарешті, 3) порівняння послідовностей з різних організмів або окремих індивідуумів.
Методи візуалізації в цих областях перебувають на різних стадіях розвитку, і ми будемо обговорювати їх переваги і недоліки. Одним з важливих моментів є те, що область геноміки швидко розвивається. Хоча ми намагалися забезпечити керівництво по методам в цій області, але цілком імовірно, що нові інструменти і формати даних з'являться, в самому найближчому майбутньому і ми обговоримо деякі з відповідних проблем. Ми закликаємо читачів, взяти до уваги ресурси онлайн, такі як SEQanswer , Де описані найбільш сучасні засоби розвитку. p> Візуалізація секвенування даних
Інтерпретація первинних даних з машинного секвенування починається з автоматизованої обробки даних. База виклику і якість розрахунків слід у разі послідовної збірки геномів або зчитування регулювання за посиланням у разі рессеквенірованія. Останні інновації в технології секвенування супроводжувалися зростанням нової збірки і погодженням програм, щоб впорається з більш короткими довжинами зчитування і великим числом операцій зчитування (для оглядів см.раб.1, 2), але стандартів не було досягнуто. Для деяких завдань аналіз візуальної перевірки цінний в тлумаченні та перевірці автоматизованих заходів, їм можна керувати за допомогою як біологічного, так і алгоритмічного шляху.
Наприклад, виявлення автоматизованого однонуклеотидний поліморфізму на основі даних секвенування залишається незавершеним, ...