Konwersja typu

Konwersja typu, zmiana typu (zmiennej w odwołaniu, wyrażenia), rzutowanie typu, przekształcenie typu – konstrukcja programistyczna umożliwiająca traktowanie danej pewnego, konkretnego typu, jak daną innego typu[1], lub taką zmianę tej danej albo jej reprezentacji w pamięci operacyjnej, aby wartość tej danej, odpowiadała według przyjętych kryteriów odwzorowania, danej innego, wybranego typu[2]. Pojęcie konwersji odnosi się także do sytuacji wyboru, rzutowania danych, które nie posiadają przypisanego typu, na wybrany, konkretny typ, celem interpretacji tych danych.

Zastosowanie konwersji typu

W językach programowania wartości, dane (reprezentowane np. przez literał, wyrażenie, a w szczególności zmienną, parametry itd.), mogą mieć przypisane różne atrybuty, w szczególności w większości języków programowania, typ danych. Fizyczną reprezentacją danych jest jednak ciąg bitów, a atrybuty przypisane danej, decydują między innymi o tym:

  • jak długi ciąg bitów stanowi określoną daną,
  • w jaki sposób jest interpretowany ciąg bitów określonej długości, stanowiący rozpatrywaną daną; ten sam ciąg bitów może być interpretowany zarówno jako liczba, łańcuch znaków, wartość logiczna itd.[a]

W programowaniu często istnieje konieczność wykonania wspólnej operacji na danych różnych typów i różnych innych atrybutów danej. Pojawia się również konieczność traktowania danej pewnego typu jak danej innego typu, oraz jak wyżej wspomniano nadanie interpretacji danym, które nie mają przypisanego typu. Realizacja wymienionych zagadnień wymaga stosowania konwersji typu.

Rodzaje konwersji

Konwersje typu mogą być rozróżniane według rozmaitych kryteriów podziału.

  • Podział ze względu na sposób specyfikacji:
    • jawne,
    • ukryte (automatyczne).
  • Podział według konstrukcji programistycznej:
  • Podział według sposobu realizacji:
    • konwersje bez zmiany sposobu reprezentacji danej w pamięci i rozmiaru danej – tylko zmiana interpretacji,
    • konwersje ze zmianą atrybutu rozmiaru danej, bez zmiany sposobu interpretacji danej,
    • konwersje ze zmianą sposobu reprezentacji bez zmiany interpretacji danej,
    • konwersje ze zmianą sposobu interpretacji danej.
  • Podział ze względu na utratę (części) informacji:
    • konwersje bez utraty informacji,
    • konwersje z częściową utratą informacji.

Języki programowania

W językach programowania są stosowane różne rozwiązania:

  • konwersje mogą być zbędne, interpretacja danej następuje w określonym kontekście według narzuconego klucza – języki operujące tylko prostymi, beztypowymi[b] danymi, np. tylko słowem, bajtem itp.: PL/M[3], BCPL[1], Bliss[1], Forth[4], ewentualne konwersje w tych językach ograniczają się do rozszerzania mniejszych danych do rozmiaru większych danych, np. danej bajtowej do dwu bajtowej (słowowej do dwusłowowej[4]),
  • konwersje mogą być niedopuszczalne,
  • konwersje mogą być dopuszczalne w określonym zakresie – wymagane jest jawne specyfikowanie konwersji,
  • konwersje mogą być dopuszczalne w określonym zakresie oraz pewne konwersje mogą być wykonywane automatycznie – większość uniwersalnych języków programowania, np. C[5], C++[6], Pascal[7][8] itd.
  • konwersje wykonywanie automatycznie, użycie danej określonego typu dopuszczalne w każdym kontekście, np. PL/1[c][9], Snobol[10].

Konstrukcje programistyczne

Konstrukcje programistyczne dotyczące wykonania konwersji typu, są elementami występującymi w kodzie źródłowym, w konkretnym języku programowania. To jakie konstrukcje są dopuszczalne wynika z przyjętych przez autorów język bądź implementacji danego języka, rozwiązań w zakresie składni i jego realizacji.

Konwersje niejawne

Konwersje niejawne są generowane przez translator. Programista kodując określony algorytm nie musi zajmować się zapisem takich konwersji; wystarczy, że jest świadomy sposobu ich wykonania przez środowisko programistyczne oraz efektów i skutków jakie wykonanie danej konwersji przyniesie. W kodzie źródłowym konwersja taka nie ma jakiegokolwiek odzwierciedlenia w tekście kodu.

Przykładem konwersji niejawnych-automatycznych, są konwersje – w językach C[5][6], C++[6], Python[11] i innych – typów arytmetycznych dokonywane automatycznie i niejawnie w wyrażeniach. Jeżeli w wyrażeniu występują wartości o różnych typach arytmetycznych, stosuje się zasadę, że operandy typów o mniejszych rozmiarach są przekształcane do typów o większych rozmiarach. Pozwala to na używanie w jednym wyrażeniu danych typów, np. char, int, long, single, double itd.[d].

Konwersje wymuszone

Konwersja danej może zostać wymuszona przez programistę, przy zastosowaniu istniejącego w języku lub implementacji mechanizmu automatycznej konwersji. Przykładem wymuszenia konwersji w języku JavaScript[12] jest umieszczenie w kodzie zapisu: „"+3. Użycie łańcucha pustego w operacji konkatenacji nie zmienia wartości łańcucha wynikowego, ale ponieważ dana reprezentowana przez literał liczbowy 3 reprezentuje całkowity typ danych, następuje wymuszone przekształcenie tej liczby na łańcuch.

Operatory konwersji

Operator umożliwia jawny zapis konwersji w kodzie źródłowym zgodnie z zasadami składni danego języka. Operatory konwersji dostępne są między innymi w takich językach jak:

  • język C[5][6], C++[6]; (typ_docelowy)wyrażenie, lub typ_docelowy(wyrażenie), np. (int)znaki, lub int(znaki),
  • PHP[13]; (typ_docelowy)wyrażenie,
  • JavaScript[12]; typ_docelowy(wyrażenie),

Podprogramy

Największe możliwości w zakresie konwersji dają podprogramy, w których można definiować różne odwzorowania, nawet dla dwóch wybranych, tych samych typów. W językach istnieją podprogramy wbudowane dla podstawowych konwersji. Także biblioteki programistyczne oferują podprogramy standardowe w tym zakresie. Największą zaletą tej metody jest możliwość definiowania własnych odwzorowań przez programistę.

Podprogramy wbudowane dostępne są m.in. w:

Referencja

Mechanizm ten oparty jest na wskazaniach tego samego obszaru pamięci przez różne zmienne wskaźnikowe, oparte na różnych typach bazowych.

 Osobny artykuł: Referencja (informatyka).

Inne, odrębne konstrukcje

W niektórych językach operacja konwersji jest odrębną kategorią jednostek składniowych, nie zaliczaną ani do operatorów, ani podprogramów, ani innych typowych konstrukcji. Tak jest np. w Turbo/Borland Pascalu[8], mimo że sam literalny zapis konwersji w kodzie źródłowym może mieć postać identyczną jak operator konwersji znany z języka C, tj.

 typ(zmienna)
 typ(wyrażenie)

np.

integer(znak)

Inne, analogiczne konstrukcje

Znaczącą analogię do konwersji typu, jako zmiany interpretacji danej bez zmiany jej reprezentacji, można dostrzec w odniesieniu do nakładania zmiennych. Mamy tu do czynienia z interpretacją danej zawartej w pewnym obszarze przynależnym do wielu zmiennych nałożonych na ten obszar pamięci, według różnych typów przypisanych do poszczególnych zmiennych.

Przykład w języku Turbo Pascal[8]:

var znak:char;
    kod:byte absolute znak;
 Osobny artykuł: Zmienna nakładana.

Inną, podobną analogię można dostrzec w odniesieniu do pól unii i pól pojedynczego wariantu w rekordzie z wariantami.

 Osobny artykuł: Unia (programowanie).
 Osobny artykuł: Rekord z wariantami.

Porównanie konstrukcji

Poniżej pokazany jest trywialny przykład konwersji danej znakowej na daną liczbową w języku Pascal, dla środowiska Turbo Pascal.

Porównanie różnych konstrukcji w Turbo Pascalu[e]
forma konwersji przykład
jawna konwersja typu
var znak:char;
    liczba:byte;
begin
  znak:='1';
  liczba:=byte(znak);
  { wypisanie liczby 49 }
  writeln(liczba)
end.
podprogram standardowy Ord
var znak:char;
    liczba:byte;
begin
  znak:='1';
  liczba:=Ord(znak);
  { wypisanie liczby 49 }
  writeln(liczba)
end.
podprogram standardowy Val
var znak:char;
    liczba:byte;
begin
  znak:='1';
  Val(znak, liczba);
  { wypisanie liczby 1 }
  writeln(liczba)
end.
referencja
var znak:char;
    liczba:^byte;
begin
  znak:='1';
  liczba:=Ptr(znak);
  { wypisanie liczby 49 }
  writeln(liczba^)
end.
nakładanie zmiennych
var znak:char;
    liczba:byte absolute znak;
begin
  znak:='1';
  { wypisanie liczby 49 }
  writeln(liczba)
end.
rekord z wariantami
var konwersja=record
      case integer of
        znak:char;
        liczba:byte;
    end;
begin
  with konwersja do
    begin
      znak:='1';
      { wypisanie liczby 49 }
      writeln(liczba)
    end
end.

Zobacz też

Uwagi

  1. Abstrahując od sensu merytorycznego takiej interpretacji.
  2. W językach tych nie istnieje pojęcie typu, co najwyżej rozmiar danej, a jej interpretacja zależy od kontekstu.
  3. W Snobolu przekształcenia takie wiążą się z przetwarzaniem łańcuchów, na które ukierunkowano ten język.
  4. W wielu językach pojęcie typu obejmuje nie tylko rodzaj zapisanej danej, ale jej wielkość, np. w języku C i pokrewnych, dane typu single i double są typu zmiennoprzecikonwego, lecz definicja języka traktuje te dane, jak dane osobnych typów; jedynie niejawna konwersja pozwala na swobodne, wspólne używanie danych tych typów łącznie i zamiennie w wyrażeniach.
  5. Przyjęto, że w danym systemie komputerowym obowiązuje tabela kodów znaków ASCII.

Przypisy

  1. a b c Michael Marcotty, Henry Ledgord: W kręgu języków programowania. Krystyna Jerzykiewicz (tum.). Warszawa: Wydawnictwa Naukowo-Techniczne, 1980, seria: Biblioteka Inżynierii Oprogramowania. ISBN 83-204-1342-7. (pol.).
  2. John E. Nicholls: Struktura języków programowania. Warszawa: Wydawnictwa Naukowo-Techniczne, 1980, seria: Informatyka. ISBN 83-204-0246-8. (pol.).
  3. Jan Bielecki: PL/M język programowania mikroprocesorów. Warszawa: Wydawnictwa Komunikacji i Łączności, 1987, seria: Elektronizacja. (pol.).
  4. a b Jan Bielecki: Język FORTH. Warszawa: Wydawnictwa Naukowo-Techniczne, 1988, seria: Mikrokomputery. ISBN 83-204-0930-6. (pol.).
  5. a b c Brian W. Kernighan, Dennis M. Ritche: Język C. Warszawa: Wydawnictwa Naukowo-Techniczne, 1988, seria: Biblioteka Inżynierii Oprogramowania. ISBN 83-204-1067-3. (pol.).
  6. a b c d e Jan Bielecki, Od C do C++, programowanie obiektowe w języku C, Wydawnictwa Naukowo-Techniczne, Warszawa 1990, ISBN 83-204-1332-X.
  7. Michał Iglewski, Jan Madey, Stanisław Matwin, Pascal. Język wzorcowy – Pascal 360., Wydawnictwa Naukowo-Techniczne, Warszawa 1984, wydanie trzecie – zmienione, Seria: Biblioteka Inżynierii Oprogramowania, ISBN 83-204-0597-1.
  8. a b c Andrzej Marciniak, Borland Pascal 7.0, Wyd. Nakom, Poznań 1994 r., seria: Biblioteka Użytkownika Mikrokomputerów ISBN 83-85060-53-7, ISSN 0867-6011.
  9. a b Jan Bielecki, Rozszerzony PL/I i JCL w systemie OS/RIAD, Państwowe Wydawnictwo Naukowe, Warszawa 1986, Seria: Biblioteka Informatyki, ISBN 83-01-06146-4.
  10. Paweł Gizbert-Studnicki, Jerzy Kaczmarczuk, Snobol4, Wydawnictwa Naukowo-Techniczne, Warszawa 1984, Seria: Biblioteka Inżynierii Oprogramowania, ISBN 83-204-0546-7.
  11. a b Marcin Owsiany, Python scripting language a obliczenia i symulacje, czerwiec 2001 r.
  12. a b Wojciech Romowicz, HTML i JavaScript, HELION 1998 r., ISBN 83-7197-046-3.
  13. Mateusz (luinnar) Juściński, PHP Konwersja i rzutowanie typów.
  14. Ryszard K. Kott, Krzysztof Walczak, Programowanie w języku Fortran 77, Warszawa: Wydawnictwa Naukowo-Techniczne, 1991, ISBN 83-204-1362-1, OCLC 749999902.