В институте курсе на четвертом нас учили программировать в байткодах для микропроцессора 8080. Для этого использовался программируемый контроллер Электроника МС 2702. Недавно мне захотелось вспомнить, как это было. Как ни странно, МС 2702 в наши дни можно найти на барахолках. Проблема заключается в том, что контроллер представляет собой черную коробку и подключаемый пульт для программирования. Для какого-то взаимодействия с пользователем требуется дополнительное оборудование, например, внешний терминал.

Программирование на ассемблере в наши дни — как правило, непрактичное занятие. Безусловно, хотя бы отдаленно представлять, из каких машинных кодов будет состоять программа, полезно и нужно. Однако новый код пишется на Си или более высокоуровневых языках, даже если это код для микроконтроллеров. Что же делать, если хочется попрограммировать что-нибудь на ассемблере (из ностальгических соображений или любых других), и чтобы это имело хоть немного практической ценности? Как вариант, можно написать программу для какого-нибудь ретро-компьютера.

Вы можете помнить заметку про интерактивный дизассемблер Hopper, в рамках которой мы познакомились с недорогой (99$) альтернативой IDA Pro. А если я скажу вам, что существует не просто недорогая, а полностью бесплатная и открытая альтернатива, которая по многим показателям превосходит Hopper, а по некоторым и саму IDA Pro? Лет 10 назад мне было бы трудно в это поверить, но сегодня существование такого решения — это объективная действительность. Решение называется Radare2.

В свете нашумевших атак на CPU (из последних атак — Meltdown и Spectre) наблюдается рост интереса к открытым процессорам. Тот факт, что спецификация и конкретные реализации таких процессоров полностью открыты, существенно упрощает их анализ с точки зрения безопасности. Еще одно преимущество открытых процессоров заключается в том, что любой производитель может просто взять и начать выпускать такие процессоры, и никто его за это не попытается засудить, как в случае с x86/x64 или ARM. Сегодня наиболее хайповыми открытыми процессорами, по всей видимости, являются процессоры RISC-V (читается «риск файф»).

Не то, чтобы мне часто приходилось что-то там дизассемблировать. Но время от времени возникает желание посмотреть, в какой ассемблерный код превратился твой код на C. Для решения этой задачи зачастую хватает objdump, но только если ты заранее знаешь, где и что именно ищешь. Для более сложных случаев возникает потребность в чем-то вроде IDA Pro. Вот только цены за IDA Pro начинаются от 589$. К счастью, есть не менее функциональная альтернатива за 99$ в лице дизассемблера Hopper.

В прошлой статье мы написали наше первое hello world приложение на асме, научились его компилировать и отлаживать, а также узнали, как делать системные вызовы в Linux. Сегодня же мы познакомимся непосредственно с ассемблерными инструкциями, понятием регистров, стека и вот этого всего. Ассемблеры для архитектур x86 (a.k.a i386) и x64 (a.k.a amd64) очень похожи, в связи с чем нет смысла рассматривать их в отдельных статьях. Притом акцент я постараюсь делать на x64, попутно отмечая отличия от x86, если они есть. Далее предполагается, что вы уже знаете, например, чем стек отличается от кучи, и объяснять такие вещи не требуется.

Сегодня мы поговорим о программировании на ассемблере. Вопрос «зачем кому-то в третьем тысячелетии может прийти в голову писать что-то на ассемблере» раскрыт в заметке Зачем нужно знать всякие низкоуровневые вещи, поэтому здесь мы к нему возвращаться не будем. Отмечу, что в рамках поста мы сосредоточимся на вопросе компиляции и отладки программ на ассемблере. Сам же язык ассемблера заслуживает отдельного большого поста, а то и серии постов.