Команда, возглавляемая Баром-Joseph Ziv Университета Карнеги-Меллон, сообщает в октябрьском выпуске журнала Nature Methods, что инструмент, названный ExpressionBlast, позволяет поиски, базирующиеся непосредственно на экспериментальных значениях, а не ключевых словах.Исследователи уже использовали ExpressionBlast, чтобы раскрыть интригующие подсказки о SIRT6, первый ген, который, как показывают, продлевал срок службы у мышей и таким образом потенциально важной цели препарата. Добывая экспериментальные данные, хранившие в общественном хранилище, назвал Gene Expression Omnibus (GEO) сохраняемым Национальным Центром информации о Биотехнологии, они нашли, что SIRT6 может быть связан с функциями, которые включают иммунную реакцию, метаболизм и регулирование генов с гендерным подходом.
«Поскольку так мало известно о SIRT6, было бы трудно искать сотни тысяч наборов данных GEO, используя ключевые слова и без другого руководства, будет практически невозможно счесть другие эксперименты с образцами экспрессии гена подобными SIRT6», заявили Бар-Joseph, адъюнкт-профессор вычислительной биологии и машинного обучения. «ExpressionBlast позволил нам взять данные об экспрессии гена SIRT6 всего из двух экспериментов на мышах и найти другие экспериментальные данные в GEO с подобным характером экспрессии».Инструмент доступен онлайн. Поисковая система позволяет исследователям искать характер экспрессии, который подобен или напротив их собственных результатов и может искать в и через разновидности.
Гай Зинмен, Шошана Найман, Ярив Кэнфи и Хаим Коэн из Университета имени Бар-Илана работали с Баром-Joseph, чтобы развивать ExpressionBlast и являются соавторами отчета о журнале. Их намерение состояло в том, чтобы разработать инструмент для вопросов экспрессии гена, которые будут эквивалентом Взрыва, инструмента в течение двух десятилетий старого для поиска баз данных последовательности генов, который остается одним из наиболее широко используемых инструментов в биоинформатике.Гены кодируют информацию, необходимую для жизни, в то время как экспрессия гена – процесс, которым та генетическая информация преобразована в белки и которым гены отрегулированы. Понимание экспрессии гена таким образом очень важно для понимания биологического и процессы болезни.
Эта информация так важна, что, в течение прошлого десятилетия или так, самые ведущие журналы потребовали исследователей, которые публикуют работы на экспрессии гена, чтобы представить их экспериментальные данные общественным хранилищам, таким как GEO.Один только GEO данные о захватах больше чем из 1 миллиона микромножеств. Каждое из этих микромножеств могло бы содержать до 40 000 численных значений – которые указывают, какие гены по – или underexpressed, и сколько. GEO и европейский Институт Биоинформатики ArrayExpress таким образом представляют находку сокровища потенциальных открытий.
Но существующие поиски часто зависят от резюме ключевого слова, представленных каждым исследователем, или требуют ручных сравнений микромножеств.ExpressionBlast использует роман, автоматизированные и масштабируемые текстовые аналитические алгоритмы, чтобы преобразовать неструктурированные данные в GEO так, чтобы это могло быть систематически обыскано. Исследователи к настоящему времени обработали десятки тысяч последовательного представления выражения сотни тысяч отдельных множеств через несколько разновидностей.
После того, как обработанный таким образом, к данным можно получить доступ легко через графический интерфейс.