W dzisiejszym artykule omówię element składni języka C, jakim jest dyrektywa preprocesora #define. Nie będzie to tekst przeznaczony dla początkujących. Skupię się raczej na bardziej zaawansowanych zastosowaniach, przydatnych sztuczkach i dobrych praktykach.

Zastosowanie dyrektywy #define – stałe i makra

Dyrektywa preprocesora #define umożliwia zdefiniowanie nazwy, która znaleziona w kodzie zostanie przez preprocesor zamieniona na odpowiednią wartość. Dyrektywa #define jest wykorzystywana w języku C do dwóch głównych celów. Można za jej pomocą definiować stałe:

Ostatni z powyższych przykładów to też jest stała, ponieważ wszystkie elementy są znane podczas kompilacji i zamiast wyrażenia zostaje wstawiona konkretna wartość.

Drugim sposobem wykorzystania dyrektywy define są makra, które różnią się od stałych tym, że przyjmują argumenty wejściowe:

Ostatni przykład do macro bezargumentowe. Możliwe jest również pominięcie pustych nawiasów w definicji macra. Dobrą praktyką jest używanie pustych nawiasów jeśli nasz define nie jest tylko stałą liczbową, ale kryje się za nim jakaś operacja wykonywana podczas działania programu. Dzięki temu w kodzie możemy łatwo odróżnić takie operacje od zwykłych stałych liczbowych:

Nazwy zarówno makr, jak i stałych zaleca się pisać z wielkich liter, żeby odróżniały się od zmiennych i funkcji.

Przydatne własności dyrektywy #define

Przedstawię teraz kilka własności dyrektywy define, które warto znać.

Rozbicie define na kilka linii

Często zdarza się chcemy stworzyć #define zawierajacy skomplikowaną operację arytmetyczną, którą chcieli byśmy rozbić na wiele linii. Z pomocą przychodzi nam znak \ umożliwiający kontynuację wyrażenia w nowej linii:

Macra składające się z wielu operacji

Macra mogą składać się z wielu operacji zakończonych średnikami. Znak kontynuacji w nowej linii przydaje się wtedy, aby zwiększyć czytelność kodu.

Takie macra coraz bardziej przypominają funkcje i w większości przypadków lepsze będzie właśnie użycie funkcji niż macra.

Macra zwracające wartość

Macra mogą też zwracać wartości.  Przy stałych liczbowych albo krótkich macrach składających się z jednej operacji takie zachowanie jest intuicyjne. Po prostu wynik operacji można przypisać do jakiejś zmiennej. Na przykład w define VBAT_THRESHOLD_VAL, zaprezentowanym wyżej, zwracaną wartością jest obliczony próg napięcia z ADC. Preprocesor po prostu zamienia symbol na jego rozwinięcie, więc takie zachowanie jest spodziewane. Okazuje się jednak, że można również zwracać wartość przez macro składające się z kilku operacji:

W powyższym przykładzie macro ustawi piny i zwróci wartość PORTA & 0x000F znajdującą się w ostatniej linii. Aby zwrócić wartość należy więc dodać do macra osobną linię kodu zawierającą wyrażenie, które chcemy zwrócić. Makra zwracające wartości mogą nie działać na wszystkich kompilatorach, albo na niektórych składnia może być inna. Przedstawiony przykład działa na kompilatorach opartych na GCC.

Operacje na stringach

Dyrektywa #define pozwala również wykonywać ciekawe operacje na stringach. Rozważmy następujący przykład:

Operator # zamienia argument podany do macra na string. Dzięki temu możemy np. drukować nazwy symboli używanych w kodzie na konsoli. Jednak czai się tutaj pewien haczyk. W kodzie powyżej są dwa printfy. Pierwszy z nich używa macra STRINGIFY wykorzystujący operator #. Wydrukuje on tekst „CPU_MODEL”, czyli nazwę symbolu podanego do macra. Aby wydrukować wartość kryjącą się pod podanym definem zamiast jego nazwy należy użyć pomocniczego macra TOSTRING. Drugi printf wydrukuje już spodziewany tekst „STM32F401RB”.

Takie zachowanie jest związane z działaniem preprocesora. Argumenty podane do makr są najpierw rozwijane na docelowe wartości, a dopiero potem wklejane do ciała makra. Wyjątkiem od tej reguły jest operator #, który przyjmuje bezpośrednio tekst przekazany w parametrze macra. Stosując macro pomocnicze TOSTRING wymuszamy konwersję symbolu przekazanego jako argument i dopiero potem przekazujemy go do zamiany na string.

Innym ciekawym operatorem działającym na stringach jest operator łączenia stringów ##. Można go użyć w następujący sposób:

Powyższy kod wydrukuje na konsolę „text1text2”. Łączenie stringów jest wykorzystywane na przykład przez frameworka do unit testów unity do tworzenia nazwy funkcji na podstawie nazwy testu i grupy:

Niebezpieczeństwa związane z używaniem makr

Używanie makr nie jest zalecane. Zamiast tego tam gdzie to możliwe lepiej używać funkcji. Dzięki temu uzyskujemy kontrolę typów argumentów, lepsze możliwości debugu i brak efektów ubocznych. O jakie efekty uboczne chodzi? Weźmy na przykład zdefiniowane wyżej macro ABS(a) i wywołajmy je w następujący sposób:

Preprocesor rozwinie je do postaci:

Jak widać zmienna b wcale nie będzie miała wartości bezwzględnej z a. Wartość zostanie przekłamana, ponieważ po porównaniu zmienna jest inkrementowana. Ze względu na ten problem w makrach nie powinno się używać wyrażeń powodujących efekty uboczne.

Inny efekt uboczny ilustruje poniższy przykład:

Spodziewamy się, że x będzie równać się (2 + 3) * 5, czyli 25. Jednak w rzeczywistości będzie się równać 2 + 3 * 5, czyli 17. Dlatego definicja macra powinna umieszczać wyrażenie arytmetyczne w nawiasach. W osobnych nawiasach powinno znaleźć się także każde wywołanie argumentu macra. W końcu jako argument możemy na przykład podać wyrażenie arytmetyczne.

Kolejny przykład pokazuje efekt uboczny związany z macrami zawierającymi wiele operacji:

Ten kod spowoduje błąd kompilacji. Rozwinięcie macra SET_BOTH_PINS spowoduje, że w ifie wykona się tylko operacja SET_PIN1(), druga operacja z macra nie będzie już elementem ifa, a else nie będzie połączony z żadnym ifem, co spowoduje błąd kompilacji. Aby się przed tym zabezpieczyć, wykorzystuje się w makrze pętlę do-while:

Dzięki temu wiele operacji zostaje spiętych w jedno wyrażenie i nie ma opisanych wcześniej efektów ubocznych.

Jak unikać zaśmiecenia kodu kompilacją warunkową

Nieraz zdarza się, że chcemy aby jakiś kod wykonywał się lub nie w zależności od parametrów kompilacji. Przyczyną może być chęć posiadania większych informacji debugowych, dodatkowych statystyk, czy różnych konfiguracji. Aby to osiągnąć, często stosuje się dyrektywy define aktywujące pewne części kodu. W funkcjach, które mają wykonywać ten opcjonalny kod często umieszcza się dyrektywy kompilacji warunkowej #ifdef:

Zastosowane rozwiązanie ma jedną poważną wadę – dyrektywy kompilacji warunkowej znajdują się w wielu miejscach. Przez to kod jest zaśmiecony dodatkowym kodem, który zmniejsza czytelność. Poza tym, jeśli na przykład chcieli byśmy zmienić nazwę define DEBUG, musimy zedytować wiele miejsc w kodzie. Istnieje jednak bardziej praktyczne rozwiązanie:

W tym przypadku mamy jedno miejsce, gdzie występuje kompilacja warunkowa. Jeśli kompilujemy bez define’a DEBUG, miejsca występowania macra DEBUG_LOG zostaną podmienione na puste linie. Jest to bardzo przydatna technika i warto o niej pamiętać.

Podsumowanie

W niniejszym artykule opisałem zastosowanie dyrektywy #define w C. Po krótkim omówieniu podstaw skupiłem się na ciekawych sposobach jej użycia i pewnych sztuczkach, które warto znać. Należy jednak pamiętać, żeby nie nadużywać tego narzędzia. Za jego pomocą można robić bardzo kreatywne i nieintuicyjne rzeczy mogące skutkować trudnym do zrozumienia kodem i różnymi efektami ubocznymi. Chyba, że chcecie wystartować w Obfuscated C code contest – wtedy nadużywanie preprocesora jest wręcz wskazane.