Nie przyśpieszysz programu pisząc go w całości w asemblerze. Faktycznie każdy program ma obszary najczęściej wywoływane ( krytyczne pętle ) i tu wystarczy zastosować wstawki w asm-ie Choć powiem, że dobry kompilator nie jest łatwo pobić. W asm-ie 86/386 ( szczególnie 16 bitowym ) jeszcze nie jest tak źle, bo architektura ta jest troche porypana z punktu widzenia metod optymalizacji w kompilatorach ale arm to już nowoczesna architektura ze stosunkowo dużą liczbą rejestrów.
Mam na dysku jakąś książkę do arm - autor udostępnia ją obecnie za darmo. Mogę podesłać namiary. Ale to nie jest pod kątem WM pisane, tylko ogólnie o programowaniu ARM-a. Do tego potrzebujesz jeszcze wiedzy o architakturze pamięci pod WM ( niespecjalnie głąbokiej czy tż obszernej) + zorganizować środowisko - translator + linker + kod startup do Twoich programów oraz jakiś wygodny w miarę edytor. Trochę to karkołomne na mój gust.
