Dlaczego w C const nie może być rozmiarem tablicy?

W C++ trwają starania, żeby praktycznie nigdy nie trzeba było korzystać z preprocesora. Jednym z typowych zastosowań define w C jest deklarowanie stałych będących rozmiarami tablic. W C++ od dawna możemy używać w tym celu const, a od jakiegoś czasu (dokładniej od C++11) również constexpr. Jednak kiedy zechcemy przenieść te praktyki do C czeka nas zawód.

Dlaczego nie chcemy używać preprocesora?

Zacznijmy od początku. Po co właściwie mielibyśmy zmieniać praktykę, która istnieje w C od dziesiątek lat? Dlaczego const miałby być lepszy? Otóż preprocesor wykonuje tylko prostą podmianę tekstu i w momencie kompilacji mamy już podmienioną wartość. Przez to z define gorzej radzą sobie sprzętowe debugery (dodatkowe linki na ten temat na końcu artykułu). Poza tym const zawiera informację o typie zmiennej, przez co możemy otrzymać dodatkowe warningi w przypadku podejrzanych operacji. No ale niestety w C nie działa to tak jak w C++.

Tablice globalne

Najczęściej tablice chcemy zadeklarować jako static, aby była zaalokowana na początku programu i widoczna w jednym pliku:

#include <stdint.h>
#include <stdlib.h>

static const size_t MAX_SIZE = 10;
static uint8_t array[MAX_SIZE] = {0};

Jednak podczas kompilacji spotka nas zawód:

<source>:5:16: error: variably modified 'array' at file scope

    5 | static uint8_t array[MAX_SIZE] = {0};

      |                ^~~~~

Błąd kompilacji występuje ponieważ w C const nie oznacza stałej, ale zmienną tylko do odczytu i deklaracja tablicy jest traktowana jak tablica o zmiennym rozmiarze (VLA – variable length array). Tak więc w przypadku tablic globalnych constów sobie nie użyjemy.

A co z tablicami wewnątrz funkcji?

Tutaj mamy dwie możliwości – tablice statyczne i alokowane na stosie. W pierwszym przypadku sytuacja jest identyczna jak z tablicą globalną:

#include <stdint.h>
#include <stdlib.h>

void fun(void)
{
    static const size_t MAX_SIZE = 10;
    static uint8_t array[MAX_SIZE];

    ...
}

I błąd kompilacji:

<source>: In function 'fun':

<source>:7:20: error: storage size of 'array' isn't constant

    7 |     static uint8_t array[MAX_SIZE];

      |                    ^~~~~

Nic dziwnego, w końcu zmienne statyczne wewnątrz funkcji są alokowane tak samo jak globalne, ale są widoczne tylko w jednej funkcji.

Przejdźmy teraz do tablic alokowanych na stosie:

#include <stdint.h>
#include <stdlib.h>

void fun(void)
{
    static const size_t MAX_SIZE = 10;
    uint8_t array[MAX_SIZE];
}

I tu niespodzianka – w końcu kompilacja się powiodła. Ale radość trwa krótko, bo okazuje się, że VLA to rozszerzenie z C99 i jeśli skompilujemy z flagami gcc -ansi -pedantic, znowu otrzymamy błąd:

<source>: In function 'fun':

<source>:7:5: warning: ISO C90 forbids variable length array 'array' [-Wvla]

    7 |     uint8_t array[MAX_SIZE];

      |     ^~~~~~~

Oznacza to, że nie mamy gwarancji, że nasz kod będzie portowalny. Poza tym samo deklarowanie tablic wewnątrz funkcji ma dosyć ograniczone zastosowanie ze względu na ograniczoną pojemność stosu.

Tak więc chyba już wystarczy tych prób – const nie nadaje się jako rozmiar tablicy w C.

Czy mamy jakąś alternatywę?

Jak widać const nie jest w stanie zastąpić define w C. Ale może jest jakaś inna alternatywa? Otóż możemy użyć enuma:

#include <stdint.h>
#include <stdlib.h>

enum
{
    MAX_SIZE = 10
};

static uint8_t array[MAX_SIZE];

Elementy enuma są stałymi liczbowymi, więc mogą być rozmiarami tablic. Dodatkowo są symbolami kompilatora, a nie preprocesora, więc debugery sobie z nimi lepiej poradzą. Natomiast użycie enuma w ten sposób jest dosyć zaskakujące, a zyski z tego niewielkie, więc nie ma sensu porzucać praktyki z define używanej od lat siedemdziesiątych.

Jeszcze parę słów o constach

Ogólnie const w C jest dosyć upośledzony względem C++. Tak jak mówiłem wcześniej const w C oznacza zmienną tylko do odczytu. Natomiast define i enum są traktowane jako stałe w czasie kompilacji. Po szczegóły odsyłam na cppreference:

W C++ constexpr i wartości liczbowe przypisane do const są również traktowane jako stałe w czasie kompilacji i dlatego możemy ich używać jako rozmiar tablicy.

Jest jeszcze jedna ważna właściwość const, która wyklucza używanie go do stałych. Może to wydać się dziwne, bo przecież sama nazwa sugeruje takie użycie. Otóż zmienne z modyfikatorem const są alokowane w pamięci, więc jeżeli w pliku zadeklarujemy długą listę stałych jako const możemy znacznie zwiększyć zużycie pamięci. Tutaj jeszcze wpływ ma poziom optymalizacji i czy deklarujemy zmienną z linkowaniem zewnętrznym (bez static), czy wewnętrznym (ze static). Ale nie zmienia to faktu, że define i enum nie mają tego problemu.

Skoro const nie spełnia swego podstawowego założenia – nasuwa się pytanie:

const w C? A komu to potrzebne?

Czasem chcemy zadeklarować stałą o typie złożonym – np. ciąg znaków, tablicę, strukturę. Robimy tak w przypadku lookup table, różnego rodzaju mapperów, maszyn stanów, configów i innych tego typu rzeczy. Wtedy define nam nie pomoże i musimy użyć const.

const jest również bardzo przydatny przy pracy z wskaźnikami. Możemy dzięki temu określić, że wartość pod wskaźnikiem się nie zmieni, albo adres wskaźnika się nie zmieni (opisywałem to kiedyś w tym artykule). Dzięki temu kompilator może dokonywać dodatkowych optymalizacji, a więcej na ten temat dowiesz się wyszukując hasło “const correctness”.

define i enum a debugowanie

Pisząc ten artykuł kierowałem się własnym doświadczeniem z debugowaniem enum i define. Wiele razy widziałem, że enumy są lepiej interpretowane. Nie powinno być w tym nic dziwnego – w końcu kompilator może zawszeć informacje o enumach w informacjach debugowych. Format DWARF przewiduje też sekcję debug_macro na informacje z preprocesora, ale widocznie nie jest to tak dobrze wspierane albo informacje nie są pełne.

Sam temat informacji debugowych jest ciekawy i znalazłem na ten temat kilka fajnych linków:

Jeżeli chcesz dowiedzieć się więcej o tym, jak pisać dobry kod w C – przygotowuję właśnie kurs online “C dla zaawansowanych”. Wejdź na https://cdlazaawansowanych.pl/ i zapisz się na mój newsletter. W ten sposób informacje o kursie na pewno Cię nie ominą.

Podobał się artykuł? Zapisz się na newsletter

Zapisz się, aby otrzymywać informacje o nowościach na blogu, ciekawe materiały oraz informacje marketingowe. W prezencie otrzymasz również dokument "Jak zwiększyć jakość kodu w projektach embedded? - darmowe narzędzia".

3 Comments

  1. Ee tam, nie rozumiem tego ciągłego narzekania na preprocesor w C. Skoro jest, to powinno się go używać (z głową oczywiście). Osobiście np. używam x-macros gdzie tylko się da i jest to moja ulubiona jego właściwość.

    • GAndaLF

      25 sierpnia 2020 at 18:59

      Masz na myśli coś takiego? https://www.geeksforgeeks.org/x-macros-in-c/

      Dla mnie to jest właśnie jeden z przykładów zaciemniania kodu przez macra. Szczególnie jeżeli to nie ty jesteś autorem, albo musisz to debugować. Chociaż głównie miałem do czynienia z tego typu macrami opartymi na sklejaniu tekstu (za pomocą ##). Samemu to się pisze bardzo fajnie, ale używanie istniejącego to zwykle był dramat. Szczególnie jak coś trzeba było zmienić.

      Pewnie – czasem te opcje preprocesora są zbawieniem, np. frameworki do unit testów je wykorzystują. Masz gotowe macra i nie wnikasz co one robią, a kod działa. Ale raczej to jest rzadka sytuacja.

      Często też zamiast takiego generowania kodu preprocesorem można podobne macra w IDE ustawić i wkleja rozwinięty kod. Potem edycja i debug są jednak dużo prostsze.

Dodaj komentarz

Your email address will not be published.

*

© 2020 ucgosu.pl

Theme by Anders NorénUp ↑