что такое ссылка и указатель в с
Урок №88. Ссылки
До этого момента мы успели рассмотреть 2 основных типа переменных:
обычные переменные, которые хранят значения напрямую;
указатели, которые хранят адрес другого значения (или null), для доступа к которым выполняется операция разыменования указателя.
Ссылки — это третий базовый тип переменных в языке C++.
Ссылки
Ссылка — это тип переменной в языке C++, который работает как псевдоним другого объекта или значения. Язык C++ поддерживает 3 типа ссылок:
Ссылки на неконстантные значения (обычно их называют просто «ссылки» или «неконстантные ссылки»), которые мы обсудим на этом уроке.
Ссылки на константные значения (обычно их называют «константные ссылки»), которые мы обсудим на следующем уроке.
В C++11 добавлены ссылки r-value, о которых мы поговорим чуть позже.
Ссылка (на неконстантное значение) объявляется с использованием амперсанда ( & ) между типом данных и именем ссылки:
В этом контексте амперсанд не означает «оператор адреса», он означает «ссылка на».
Ссылки в качестве псевдонимов
Ссылки обычно ведут себя идентично значениям, на которые они ссылаются. В этом смысле ссылка работает как псевдоним объекта, на который она ссылается, например:
Результат выполнения программы:
В примере, приведенном выше, объекты ref и value обрабатываются как одно целое. Использование оператора адреса с ссылкой приведет к возврату адреса значения, на которое ссылается ссылка:
Краткий обзор l-value и r-value
На уроке №10 мы уже рассматривали, что такое l-value и r-value. l-value — это объект, который имеет определенный адрес памяти (например, переменная x ) и сохраняется за пределами одного выражения. r-value — это временное значение без определенного адреса памяти и с областью видимости выражения (т.е. сохраняется в пределах одного выражения). В качестве r-values могут быть как результаты выражения (например, 2 + 3 ), так и литералы.
Инициализация ссылок
Ссылки должны быть инициализированы при создании:
В отличие от указателей, которые могут содержать нулевое значение, ссылки нулевыми быть не могут.
Ссылки на неконстантные значения могут быть инициализированы только неконстантными l-values. Они не могут быть инициализированы константными l-values или r-values:
Обратите внимание, во втором случае вы не можете инициализировать неконстантную ссылку константным объектом. В противном случае, вы бы могли изменить значение константного объекта через ссылку, что уже является нарушением понятия «константа».
После инициализации изменить объект, на который указывает ссылка — нельзя. Рассмотрим следующий фрагмент кода:
Обратите внимание, во втором стейтменте ( ref = value2; ) выполняется не то, что вы могли бы ожидать! Вместо переприсваивания ref (ссылаться на переменную value2 ), значение из value2 присваивается переменной value1 (на которое и ссылается ref ).
Ссылки в качестве параметров в функциях
Ссылки чаще всего используются в качестве параметров в функциях. В этом контексте ссылка-параметр работает как псевдоним аргумента, а сам аргумент не копируется при передаче в параметр. Это в свою очередь улучшает производительность, если аргумент слишком большой или затратный для копирования.
На уроке №82 мы говорили о том, что передача аргумента-указателя в функцию позволяет функции при разыменовании этого указателя напрямую изменять значение аргумента.
Ссылки работают аналогично. Поскольку ссылка-параметр — это псевдоним аргумента, то функция, использующая ссылку-параметр, может изменять аргумент, переданный ей, также напрямую:
Результат выполнения программы:
Совет: Передавайте аргументы в функцию через неконстантные ссылки-параметры, если они должны быть изменены функцией в дальнейшем.
Основным недостатком использования неконстантных ссылок в качестве параметров в функциях является то, что аргумент должен быть неконстантным l-value (т.е. константой или литералом он быть не может). Мы поговорим об этом подробнее (и о том, как это обойти) на следующем уроке.
Ссылки как более легкий способ доступа к данным
Второе (гораздо менее используемое) применение ссылок заключается в более легком способе доступа к вложенным данным. Рассмотрим следующую структуру:
Таким образом, следующие два стейтмента идентичны:
Ссылки позволяют сделать ваш код более чистым и понятным.
Ссылки vs. Указатели
Ссылка — это тот же указатель, который неявно разыменовывается при доступе к значению, на которое он указывает («под капотом» ссылки реализованы с помощью указателей). Таким образом, в следующем коде:
*ptr и ref обрабатываются одинаково. Т.е. это одно и то же:
Поскольку ссылки должны быть инициализированы корректными объектами (они не могут быть нулевыми) и не могут быть изменены позже, то они, как правило, безопаснее указателей (так как риск разыменования нулевого указателя отпадает). Однако они немного ограничены в функциональности по сравнению с указателями.
Если определенное задание может быть решено с помощью как ссылок, так и указателей, то лучше использовать ссылки. Указатели следует использовать только в тех ситуациях, когда ссылки являются недостаточно эффективными (например, при динамическом выделении памяти).
Заключение
Ссылки позволяют определять псевдонимы для других объектов или значений. Ссылки на неконстантные значения могут быть инициализированы только неконстантными l-values. Они не могут быть переприсвоены после инициализации. Ссылки чаще всего используются в качестве параметров в функциях, когда мы хотим изменить значение аргумента или хотим избежать его затратного копирования.
Поделиться в социальных сетях:
Что такое ссылка и указатель в с
Указатели совместно с адресной арифметикой играют в Си особую роль. Можно сказать, что они определяют лицо языка. Благодаря им Си может считаться одновременно языком высокого и низкого уровня по отношению к памяти.
Если говорить о понятиях указатель, ссылка, объект, то они встречаются не только в языках программирования, но в широком смысле в информационных технологиях. Когда речь идет о доступе к информационным ресурсам, то существуют различные варианты доступа к ним:
В языках программирования термины объект (значение), указатель и ссылка имеют примерно аналогичный смысл, но касаются способов доступа и передачи значений переменных.
· при передаче формальных параметров при вызове процедур (функций) практически во всех языках программирования реализованы способы передачи по ссылке и по значению;
· в Паскале и Си определено понятие указатель как переменная особого вида, содержащая адрес размещения в памяти другой переменной. Использование указателей позволяется создавать динамические структуры данных, в которых элементы взаимно ссылаются друг на друга;
Указатель в Си
Передавать данные между программами, данные от одной части программы к другой (например, от вызывающей функции к вызываемой) можно двумя способами :
· создавать в каждой точке программы (например, на входе функции) копию тех данных, которые необходимо обрабатывать ;
Наряду с указателем в программировании также используется термин ссылка. Ссылка – содержанием ссылки также является адресная информация об объекте (переменной), но внешне она выглядит как переменная (синоним оригинала).
В языках программирования имя переменной ассоциируется с адресом области памяти, в которой транслятор размещает ее в процессе трансляции программы. Все операции над обычными переменными преобразуются в команды с прямой адресацией к соответствующим словам памяти.
· указатель, который содержит адрес переменной, ссылается на эту переменную или назначен на нее;
· переменная, адрес которой содержится в указателе, называется указуемой переменной.
рис. 52-2. Определение указателя и операции над ним
Последовательность действий при работе с указателем включает 3 шага:
1. Определение указуемых переменных и переменной-указателя. Для переменной-указателя это делается особым образом.
int a,x; // Обычные целые переменнные
2. Связывание указателя с указуемой переменной. Значением указателя является адрес другой переменной. Следующим шагом указатель должен быть настроен, или назначен на переменную, на которую он будет ссылаться.
p = &a; // Указатель содержит адрес переменной a
3. И наконец, в любом выражении косвенное обращение по указателю интерпретируется как переход от него к указуемой переменной с выполнением над ней всех далее перечисленных в выражении операций.
* p =100; // Эквивалентно a =100
x = x + *p; // Эквивалентно x = x + a
(* p )++; // Эквивалентно a ++
Замечание: при обращении через указатель имя указуемой переменной в выражении отсутствует. Поэтому можно считать, что обращение через указатель производится к «безымянной» переменной, а операцию « *» называются также операцией разыменования указателя.
Указатель дает « степень свободы» или универсальности любому алгоритму обра
ботки данных. Действительно, если некоторый фрагмент программы получает данные непосредственно в некоторой переменной, то он может обрабатывать ее и только ее. Если же данные он получает через указатель, то обработка данных (указуемых переменных) может производиться в любой области памяти компьютера (или программы). При этом сам фрагмент может и «не знать», какие данные он обрабатывает, если значение самого указателя передано программе извне.
Адресная арифметика и управление памятью
Способность указателя ссылаться на «отдельно стоящие» переменные не меняет качества языка, поскольку нельзя выйти за рамки множества указуемых переменных, определенных в программе. Такая же концепция указателя принята, например, в Паскале. Но в Си существует еще одна, расширенная интерпретация, позволяющая через указатель работать с массивами и с памятью компьютера ни низком (архитектурном) уровне без каких-либо ограничений со стороны транслятора. Это «свобода самовыражения» обеспечивается одной дополнительной операцией адресной арифметики. Но сначала определим свойства указателя в соответствии с расширенной интерпретацией.
Любой указатель в Си ссылается на неограниченную в обе стороны область памяти (массив), заполненную переменными указуемого типа с индексацией элементов относительно текущего положения указателя.
· любой указатель потенциально ссылается на неограниченную в обе стороны область памяти, заполненную переменными указуемого типа;
· результатом операции указатель+i является адрес i-ой переменной (значение указателя на i-ую переменную) в этой области относительно текущего положения указателя.
Значение указуемой переменной
Указатель на i-ю переменную после указуемой
Указатель на i-ю переменную перед указуемой
Значение i-й переменной после указуемой
Значение i-й переменной после указуемой
Переместить указатель на следующую переменную
Переместить указатель на предыдущую переменную
Переместить указатель на i переменных вперед
Переместить указатель на i переменных назад
Получить значение указуемой переменной и переместить указатель к следующей
Переместить указатель к переменной, предшествующей указуемой, и получить ее значение
Указатель на свободную память вслед за указуемой переменной
Если МАССИВ=ПАМЯТЬ+УКАЗАТЕЛЬ (начальный адрес), то УКАЗАТЕЛЬ=МАССИВ-ПАМЯТЬ, т.е. указатель это «массив без памяти», «свободно перемещающийся по памяти» массив.
Различия и сходства
Оба интерпретируются как указатели и оба имеют тип int *
Указатель требует настройки «на память»
Работа с областью памяти как с обычным массивом, так и через указатель полностью идентична вплоть до синтаксиса
Указатель может перемещаться по памяти относительно своего текущего положения
Идентификатор массива без скобок интерпретируется как адрес нулевого элемента нулевой строки, или указатель на базовый тип данных. В нашем примере идентификатору A будет соответствовать выражение &A[0][0] с типом char*.
Имя двумерного массива с единственным индексом интерпретируется как начальный адрес соответствующего внутреннего одномерного массива. A[i] понимается как &A[i][0], то есть начальный адрес i-го массива символов.
От такого многообразия возможностей работы с указателями нетрудно прийти в замешательство: как вообще с ними работать, кто за что отвечает? Действительно, при работе с указателями легко выйти «за рамки дозволенного», т.е. определенных самим же программистом структур данных. Поэтому попробуем еще раз обсудить принципиальные моменты адресной арифметики.
· наличие операции инкремента или индексации говорит о работе указателя с памятью (массивом) ;
· использование исключительно операции косвенного обращения по указателю свидетельствует о работе с отдельной переменной.
· неинициализированный указатель. После определения указатель ссылается «в никуда», тем не менее программист работает через него с переменной или массивом, записывая данные по случайным адресам;
· несколько указателей, ссылающихся на общий массив – это все-таки один массив, а не несколько. Если программа работает с несколькими массивами, то они должны либо создаваться динамически, либо браться из двумерного массива;
· выход указателя за границы памяти. Например, конец строки отмечается символов ‘\0’, начало же формально соответствует начальному положению указателя. Если в процессе работы со строкой требуется возвращение на ее начало, то начальный указатель необходимо запоминать, либо дополнительно отсчитывать символы.
Другие операции над указателями
В процессе определения указателей мы рассмотрели основные операции над ними:
· операция присваивания указателей одного типа. Назначение указателю адреса переменной p=&a есть одни из вариантов такой операции;
· операция косвенного обращения по указателю (разыменования указателя);
· операция адресной арифметики «указатель+целое» и все производные от нее.
Значение NULL может быть присвоено любому указателю. Если указатель по логике работы программы может иметь такое значение, то перед косвенным обращением по нему его нужно проверять на достоверность:
//— Симметричная перестановка символов строки
< char c; c=*p; *p=*q; *q=c; >// 3 стакана над переменными под указателями
extern int fread(void *, int, int, FILE *);
fread(A, sizeof(int), 20, fd);
extern void *malloc(int);
int *p = (int*)malloc(sizeof(int)*20); // Явное преобразование void* к int*
Указатель как формальный параметр и результат функции
Если же фактический параметр должен быть изменен, то формальный параметр можно определить как явный указатель. Тогда фактический параметр должны быть явно передан в виде указателя на ту переменную (с использованием операции &).
< (* pi )++; >// аналог вызова: pi = & a
inc (& a ); > // *( pi )++ эквивалентно a ++
int sum(int A[],int n) // Исходная программа
int sum(int *p, int n) // Эквивалент с указателем
< x = sum(B,10); >// аналог вызова : p = B, n = 10
В вызове фигурирует идентификатор массива, который интерпретируется как указатель на начало. Поэтому типы формального и фактического параметров совпадают. Совпадают также оба варианта функций вплоть до генерируемого кода.
· глобальные переменные программы;
· формальные параметры, если они являются массивами, указателями или ссылками, то есть «за ними стоят» другие переменные.
Функция не может возвратить указатель на локальную переменную или формальный параметр-значение, поскольку они разрушаются при выходе из функции. Это приводит к ошибке времени выполнения, не обнаруживаемой транслятором.
Пример: функция возвращает указатель на минимальный элемент массива. Массив передается как формальный параметр.
int *min(int A[], int n)<
int *pmin, i; // Рабочий указатель, содержащий результат
Ссылка как неявный указатель
Во многих языках программирования указатель присутствует, но в завуалированном виде в форме ссылки. Под ссылкой понимается переменная, которая не имеет самостоятельного значения, а отображается на другую переменную, т.е. является ее синонимом. Во всем остальном она не отличается от обычной переменной. В отличие от явного указателя обращение по ссылке к объекту-прототипу имеет тот же самый синтаксис, что и обращение к объекту-прототипу.
int a =5; // Переменная – прототип
b ++; // Операция над b есть операция над прототипом a
· при передаче по значению формальный параметр является копией фактического, он может быть изменен независимо от значения оригинала – фактического параметра. Такой параметр является исключительно входным;
· при передаче по ссылке формальный параметр отображается на фактический, и его изменение сопровождается изменением фактического параметра-прототипа. Такой параметр может быть как входным, так и выходным.
//—— Функция возвращает ссылку на минимальный элемент массива
int &ref_min(int A[], int n)<
//—— Функция возвращает указатель на минимальный элемент массива
int *ptr_min(int *p, int n)<
Строки, массивы символов и указатель char *
int n; // указателем на на строку char*
· создание массива символов с размерностью, достаточной для размещения строки;
· инициализацию (заполнение) массива символами строки, дополненной символом ‘\0’;
char * q = «ABCD»;; // Программа
char *q; // Эквивалент
В связи с этим в Си возможны довольно странные выражения с участием строковых констант:
char c2 = («12345» + 2)[1];
extern int strcmp(char *, char*);
Посмотрим, как все вышесказанное выглядит на практике.
//—- Поиск в строке заданного фрагмента
> // иначе продолжить поиск
Для обнаружения всех фрагментов достаточно передавать для каждого последующего вызова функции указатель на часть строки, непосредственно следующей за найденным фрагментом.
//—— Поиск всех вхождений фрагмента в строке
for (s=find(c,q); s!=NULL; s=find(s+strlen(q),q)) puts(s);
//—- Поиск слова максимальной длины посимвольная обработка
int n,lmax; char *pmax;
for (n=0,lmax=0,pmax=NULL; *s!=0;s++)<
n =0; // фиксация максимального значения
//—- Сортировка слов в строке в порядке убывания (выбором)
void sort(char *in, char *out)
* out ++= * q ; * q ++=’ ‘; // Переписать с затиранием
* out ++=’ ‘; // После слова добавить пробел
Лабораторный практикум
1. Функция находит минимальный элемент массива и возвращает указатель на него. С использованием этой функции реализовать сортировку выбором.
2. Шейкер-сортировка с использованием указателей на правую и левую границы отсортированного массива и сравнения указателей.
3. Функция находит в строке пары одинаковых фрагментов и возвращает указатель на первый. С помощью функции найти все пары одинаковых фрагментов.
4. Функция находит в строке пары инвертированных фрагментов (например «123apr» и «rpa321») и возвращает указатель на первый. С помощью функции найти все пары.
5. Функция производит двоичный поиск места размещения нового элемента в упорядоченном массиве и возвращает указатель на место включения нового элемента. С помощью функции реализовать сортировку вставками.
6. Функция находит в строке десятичные константы и заменяет их на шестнадцатеричные с тем же значением, например «aaaaa258xxx» на «aaaaa0x102xxx».
7. Функция находит в строке символьные константы и заменяет их на десятичные коды, например «aaa’6’xxx» на «aaa54xxx».
8. Функция находит в строке самое длинное слово и возвращает указатель на него. С ее помощью реализовать размещение слов в выходной строке в порядке убывания их длины.
9. Функция находит в строке самое первое (по алфавиту) слово. С ее помощью реализовать размещение слов в выходной строке в алфавитном порядке.
10. Функция находит в строке симметричный фрагмент вида » abcdcba » длиной 7 и более символов (не содержащий пробелов) и возвращает указатель на его начало и длину. С использованием функции «вычеркнуть» все симметричные фрагменты из строки.
11. «Быстрая» сортировка (разделением) с использованием указателей на правую и левую границы массива, текущих указателей на правый и левый элемент и операции сравнения указателей (см. 7.2).
Вопросы без ответов
Определите, используется ли указатель для доступа к отдельной переменной или к массиву. Напишите вызов функции с соответствующими фактическими параметрами – адресами переменных или именами массивов.
void F(int *p, int *q, int n)<
F(A,&x,5); printf(«x=%d\n»,x); > // Выведет 13