Будучи маленькими детьми, многим было интересно узнать, как устроены игрушки изнутри. Для этого их часто разбирали на мелкие детали. Оказывается, что в современном мире некоторые специалисты занимаются приблизительно тем же самым, только вместо машинок и солдатиков у них программы и приложения. Речь идет о технологии ревёрс-инжиниринга, которая достаточно популярна в высокотехнологичных отраслях.
Что такое ревёрс-инжиниринг
Предположим, что к разработчику попадает exe-файл с программой, разработанной компанией-конкурентом. Руководство ставит перед программистом задачу – изучить полученный прототип и понять как он работает. На первый взгляд может показаться, что задача не решаема. Действительно, если рассуждать в рамках стандартной парадигмы разработки, возникает множество вопросов.
Классическая или прямая парадигма разработки состоит в следующем:
- специалист пишет код на любом языке, будь то Python, JavaScript или C#;
- написанный код отдается на обработку компилятору. Он создает из программы бинарный файл, который может прочитать компьютер;
- скомпилированная программа распространяется среди пользователей, которые могут ее скачать и установить себе на ПК.
Бинарный или исполняемый файл представляет собой машинный код, состоящий из большого числа нулей и единиц. Прочитать его человек не может, следовательно, понять, как устроена программа не представляется возможным.
Чтобы выйти из такой ситуации и была разработана технология ревёрс-инжиниринга. Слово «ревёрс» указывает на то, что разработка идет в обратном направлении. При помощи специальных программ бинарные файлы преобразуются в формат, понятный человеку.
Алгоритм выглядит следующим образом:
- программисту дают бинарный файл, который способен прочитать только компьютер;
- этот файл загружается в специальную программу, результатом работы которой становится код на понятном человеку языке программирования;
- разработчик изучает код и разбирается с тем, как работает программа «под капотом».
Многие ошибочно полагают, что в ревёрс-инжиниринге нет ничего сложного, достаточно прогнать бинарный файл через программу, которая сделает все сама. На практике все совсем не так. Опытные специалисты тратят недели и даже месяцы на то, чтобы разобраться в устройстве исходной программы. Иногда полностью узнать содержимое так и не получается.
Зачем нужен ревёрс-инжиниринг
Обратное проектирование позволяет разобраться с тем, как функционируют программы, какими данными они пользуются и куда их передают. Такой подход к разработке показывает слабые места продукта и его реакцию на внештатные ситуации. Располагая такой информацией, разработчики могут создать собственную программу, которая будет превосходить аналоги конкурентов.
Важно понимать, что большинство разработчиков запрещают расшифровывать свои программы. Соответствующий пункт есть в лицензионном соглашении. Поэтому используя ревёрс-инжиниринг нужно помнить о последствиях. Однако есть и легальный способ. Необходимо договориться с компанией-поставщиком, которая даст официальное разрешение.
Обратная разработка наиболее распространена в следующих областях:
- изучение вредоносного ПО – компании, занимающиеся кибербезопасностью, активно используют ревёрс-инжиниринг для анализа различных вирусов. Они специально заражают ими свои компьютеры и наблюдают за тем, как те работают. На основе полученной информации создаются средства защиты;
- создание игровых модов – с их помощью разработчики меняют игровой процесс, добавляют новые локации, изменяют существующие и т.д. Обратная разработка позволяет делать это наиболее эффективно. С ее помощью были созданы многие моды, пользующиеся популярностью среди геймеров;
- анализ устаревших технологий – если приложение или программа была написана давно, документация к ней могла не сохраниться. В этом случае программистам приходиться полностью восстанавливать код.
Способы и этапы ревёрс-инжиниринг
То, что обратное проектирование позволяет переводить бинарные файлы на понятный человеку язык программирования, еще не дает представления о том, как именно устроен этот процесс. На сегодняшний день принято выделять три основных способа.
Перевод машинного кода на высокоуровневый язык программирования
Главную роль в этом процессе играют специальные программы – дизассемблеры. Они способны прочитать бинарный файл и перевести его на человекопонятный язык программирования. Чаще всего это C++. Однако у этого способа есть один серьезный недостаток. Код, полученный в результате работы дизассемблера, не содержит комментариев и названий переменных. Это очень усложняет работу программистам. Им приходится долго разбираться для чего нужны те или иные программные блоки.
Перевод машинного кода на язык ассемблера
Ассемблер представляет собой низкоуровневый язык, который располагается выше машинного кода, но ниже чем привычные Python или Java. Преимущество ассемблера в том, что с ним могут работать абсолютно все процессоры. Поэтому с точки зрения компьютера, это самый простой метод расшифровки бинарных файлов.
Понять программу, написанную на ассемблере, под силу далеко не каждому программисту. Особенно без предварительной подготовки. Разработчик должен разбираться в устройстве процессора, знать команды, которыми он пользуется и т.д.
Анализ данных, пересылаемых программой
Как правило программы обмениваются данными с помощью интернета или непосредственно внутри компьютера, используя для этого операционную систему. Зная это, ревёрс-инженеры используют сетевые анализаторы, с помощью которых также можно понять устройство программы. К примеру, популярный браузер Google Chrome содержит встроенный сетевой анализатор. Им можно воспользоваться, нажав клавишу «F12» и перейдя в пункт «Network».
Зная способы ревёрс-инжиниринга можно разобраться с самим процессом обратной разработки. Он состоит из четырех этапов. Первым, из которых является предварительное исследование программы. По сути разработчики выступают в роли пользователя. Они нажимают на кнопки, используют все доступные функции и смотрят за тем, что происходит. Это помогает понять, как в целом работает продукт.
Затем начинается непосредственно демонтаж. Разработчикам нужно понять, как программа устроена изнутри. В этом им помогают способы, описанные выше. Далее полученный код внимательно изучается. Необходимо понять какие алгоритмы и структуры данных использовались, за что отвечают определенные блоки и т.д.
Когда специалист во всем этом разобрался, он должен составить полную картину, соединить все части воедино. При обратной разработке важно выстроить правильную последовательность выполнения всех методов.
Завершающим этапом является создание документации. Разработчик должен зафиксировать, какие функции и переменные используются в программе, за что они отвечают, куда и как отправляются данные. Все это составляет основу технической документации, которая позволяет другим разработчикам без труда разобраться в том, что делает тот или иной блок кода.
Заключение
Не стоит забывать, что обратная разработка – это длительный процесс. Чтобы понять как устроена программа, специалист должен обладать опытом в программировании. Однако новичкам также стоит попробовать себя в ревёрс-инжиниринге. Это хорошо развивает навыки и помогает узнать много нового. Начинать лучше с простых программ, и постепенно переходить к более сложным.