Nie traktuje tej prostoty w sposób dogmatyczny ale jak porównam do i386 to jest jednak prościej - rejestry nie są dzielone na podrejestry, nie ma operacji na pamięci tylko wszystko najpierw idzie do rejestrów przed operacją. A jeśli chodzi o operacje A= B<<c to chyba zapomniałeś o LEA w intelu. Mam na myśli rozszerzenie LEA z ia32 oczywiście.

Nie jest tak źle z intelem. Aha i porównaj sobie binarny format rozkazów - nie jest jednak prościej w ARM?
Trochę poszperałem w necie i wygląda na to, że ten referencyjny sterownik jest najwolniejszym z możliwych a ten, który mamy jest software-owy ale używa multimedialnych instrukcji procka toski - nie wszystkie ARM-y je mają.

Szkoda tylko, że nasza nvidia nie ma trybu R8G8B8.
