W C++ trwają starania, żeby praktycznie nigdy nie trzeba było korzystać z preprocesora. Jednym z typowych zastosowań define
w C jest deklarowanie stałych będących rozmiarami tablic. W C++ od dawna możemy używać w tym celu const
, a od jakiegoś czasu (dokładniej od C++11) również constexpr
. Jednak kiedy zechcemy przenieść te praktyki do C czeka nas zawód.
Dlaczego nie chcemy używać preprocesora?
Zacznijmy od początku. Po co właściwie mielibyśmy zmieniać praktykę, która istnieje w C od dziesiątek lat? Dlaczego const miałby być lepszy? Otóż preprocesor wykonuje tylko prostą podmianę tekstu i w momencie kompilacji mamy już podmienioną wartość. Przez to z define
gorzej radzą sobie sprzętowe debugery (dodatkowe linki na ten temat na końcu artykułu). Poza tym const
zawiera informację o typie zmiennej, przez co możemy otrzymać dodatkowe warningi w przypadku podejrzanych operacji. No ale niestety w C nie działa to tak jak w C++.
Tablice globalne
Najczęściej tablice chcemy zadeklarować jako static
, aby była zaalokowana na początku programu i widoczna w jednym pliku:
#include <stdint.h> #include <stdlib.h> static const size_t MAX_SIZE = 10; static uint8_t array[MAX_SIZE] = {0};
Jednak podczas kompilacji spotka nas zawód:
<source>:5:16: error: variably modified 'array' at file scope 5 | static uint8_t array[MAX_SIZE] = {0}; | ^~~~~
Błąd kompilacji występuje ponieważ w C const
nie oznacza stałej, ale zmienną tylko do odczytu i deklaracja tablicy jest traktowana jak tablica o zmiennym rozmiarze (VLA – variable length array). Tak więc w przypadku tablic globalnych constów sobie nie użyjemy.
A co z tablicami wewnątrz funkcji?
Tutaj mamy dwie możliwości – tablice statyczne i alokowane na stosie. W pierwszym przypadku sytuacja jest identyczna jak z tablicą globalną:
#include <stdint.h> #include <stdlib.h> void fun(void) { static const size_t MAX_SIZE = 10; static uint8_t array[MAX_SIZE]; ... }
I błąd kompilacji:
<source>: In function 'fun': <source>:7:20: error: storage size of 'array' isn't constant 7 | static uint8_t array[MAX_SIZE]; | ^~~~~
Nic dziwnego, w końcu zmienne statyczne wewnątrz funkcji są alokowane tak samo jak globalne, ale są widoczne tylko w jednej funkcji.
Przejdźmy teraz do tablic alokowanych na stosie:
#include <stdint.h> #include <stdlib.h> void fun(void) { static const size_t MAX_SIZE = 10; uint8_t array[MAX_SIZE]; }
I tu niespodzianka – w końcu kompilacja się powiodła. Ale radość trwa krótko, bo okazuje się, że VLA to rozszerzenie z C99 i jeśli skompilujemy z flagami gcc -ansi -pedantic
, znowu otrzymamy błąd:
<source>: In function 'fun': <source>:7:5: warning: ISO C90 forbids variable length array 'array' [-Wvla] 7 | uint8_t array[MAX_SIZE]; | ^~~~~~~
Oznacza to, że nie mamy gwarancji, że nasz kod będzie portowalny. Poza tym samo deklarowanie tablic wewnątrz funkcji ma dosyć ograniczone zastosowanie ze względu na ograniczoną pojemność stosu.
Tak więc chyba już wystarczy tych prób – const
nie nadaje się jako rozmiar tablicy w C.
Czy mamy jakąś alternatywę?
Jak widać const
nie jest w stanie zastąpić define w C. Ale może jest jakaś inna alternatywa? Otóż możemy użyć enuma:
#include <stdint.h> #include <stdlib.h> enum { MAX_SIZE = 10 }; static uint8_t array[MAX_SIZE];
Elementy enuma są stałymi liczbowymi, więc mogą być rozmiarami tablic. Dodatkowo są symbolami kompilatora, a nie preprocesora, więc debugery sobie z nimi lepiej poradzą. Natomiast użycie enuma w ten sposób jest dosyć zaskakujące, a zyski z tego niewielkie, więc nie ma sensu porzucać praktyki z define
używanej od lat siedemdziesiątych.
Jeszcze parę słów o constach
Ogólnie const
w C jest dosyć upośledzony względem C++. Tak jak mówiłem wcześniej const
w C oznacza zmienną tylko do odczytu. Natomiast define
i enum
są traktowane jako stałe w czasie kompilacji. Po szczegóły odsyłam na cppreference:
W C++ constexpr
i wartości liczbowe przypisane do const
są również traktowane jako stałe w czasie kompilacji i dlatego możemy ich używać jako rozmiar tablicy.
Jest jeszcze jedna ważna właściwość const
, która wyklucza używanie go do stałych. Może to wydać się dziwne, bo przecież sama nazwa sugeruje takie użycie. Otóż zmienne z modyfikatorem const
są alokowane w pamięci, więc jeżeli w pliku zadeklarujemy długą listę stałych jako const
możemy znacznie zwiększyć zużycie pamięci. Tutaj jeszcze wpływ ma poziom optymalizacji i czy deklarujemy zmienną z linkowaniem zewnętrznym (bez static
), czy wewnętrznym (ze static
). Ale nie zmienia to faktu, że define
i enum
nie mają tego problemu.
Skoro const
nie spełnia swego podstawowego założenia – nasuwa się pytanie:
const
w C? A komu to potrzebne?
Czasem chcemy zadeklarować stałą o typie złożonym – np. ciąg znaków, tablicę, strukturę. Robimy tak w przypadku lookup table, różnego rodzaju mapperów, maszyn stanów, configów i innych tego typu rzeczy. Wtedy define nam nie pomoże i musimy użyć const
.
const
jest również bardzo przydatny przy pracy z wskaźnikami. Możemy dzięki temu określić, że wartość pod wskaźnikiem się nie zmieni, albo adres wskaźnika się nie zmieni (opisywałem to kiedyś w tym artykule). Dzięki temu kompilator może dokonywać dodatkowych optymalizacji, a więcej na ten temat dowiesz się wyszukując hasło „const correctness”.
define
i enum
a debugowanie
Pisząc ten artykuł kierowałem się własnym doświadczeniem z debugowaniem enum
i define
. Wiele razy widziałem, że enumy są lepiej interpretowane. Nie powinno być w tym nic dziwnego – w końcu kompilator może zawszeć informacje o enumach w informacjach debugowych. Format DWARF przewiduje też sekcję debug_macro
na informacje z preprocesora, ale widocznie nie jest to tak dobrze wspierane albo informacje nie są pełne.
Sam temat informacji debugowych jest ciekawy i znalazłem na ten temat kilka fajnych linków:
- Introduction to DWARF debugging format
- How debuggers work – debugging information
- Exploring the DWARF debug format information
Jeżeli chcesz dowiedzieć się więcej o tym, jak pisać dobry kod w C – przygotowuję właśnie kurs online “C dla zaawansowanych”. Wejdź na https://cdlazaawansowanych.pl/ i zapisz się na mój newsletter. W ten sposób informacje o kursie na pewno Cię nie ominą.
25 sierpnia 2020 at 11:16
Ee tam, nie rozumiem tego ciągłego narzekania na preprocesor w C. Skoro jest, to powinno się go używać (z głową oczywiście). Osobiście np. używam x-macros gdzie tylko się da i jest to moja ulubiona jego właściwość.
25 sierpnia 2020 at 18:59
Masz na myśli coś takiego? https://www.geeksforgeeks.org/x-macros-in-c/
Dla mnie to jest właśnie jeden z przykładów zaciemniania kodu przez macra. Szczególnie jeżeli to nie ty jesteś autorem, albo musisz to debugować. Chociaż głównie miałem do czynienia z tego typu macrami opartymi na sklejaniu tekstu (za pomocą ##). Samemu to się pisze bardzo fajnie, ale używanie istniejącego to zwykle był dramat. Szczególnie jak coś trzeba było zmienić.
Pewnie – czasem te opcje preprocesora są zbawieniem, np. frameworki do unit testów je wykorzystują. Masz gotowe macra i nie wnikasz co one robią, a kod działa. Ale raczej to jest rzadka sytuacja.
Często też zamiast takiego generowania kodu preprocesorem można podobne macra w IDE ustawić i wkleja rozwinięty kod. Potem edycja i debug są jednak dużo prostsze.
25 sierpnia 2020 at 21:17
Dokładnie tak. Tutaj trochę lepszy link:
https://stackoverflow.com/questions/6635851/real-world-use-of-x-macros
I seria 3 artykułów na embedded.com:
https://www.embedded.com/reduce-c-language-coding-errors-with-x-macros-part-1/
Kod może wyglądać na zaciemniony na pierwszy rzut oka dla kogoś, kto się z tym mechanizmem dotychczas nie spotkał. Jak się ich trochę poużywa, to można się przyzwyczaić, a z czasem ciężko bez nich żyć. Tworzysz sobie wszystkie potrzebne makra raz, a potem tylko rozszerzasz główne makro o kolejne wpisy (czyli robisz zmianę tylko w jednym miejscu), a cała reszta dokonuje się automagicznie.
Oszczędność czasu i minimalizacja pomyłek ogromna.