IT일반

프로그래밍 | 파이썬 - 자료형(3) | 문자열 자료형에 대해 알아보자(2) - 문자열 인덱싱, 문자열 슬라이싱, 문자열 길이 함수 len()

블로그 하는 으노 2024. 10. 2. 17:10
반응형

문자열의 인덱스

문자열에 포함된 문자는 각각의 번호를 갖게 된다. 이를 인덱스(우리말로 색인)라고 한다. name이라는 변수를 선언하고 'potato'를 할당하자. 이 문자열의 인덱스를 확인하기 위해 name[인덱스 번호]를 입력해보면 된다.

제일 첫 글자의 인덱스가 1부터 시작하지 않는다. 0부터 시작하기 때문에 여섯 글자이지만 마지막 글자의 인덱스는 5이다. 6번이 없기 때문에 name[6]에서 에러가 났다. 인덱스는 음수로도 확인할 수 있는데, 음수이기 때문에 거꾸로 센다고 생각하면 된다. -0은 없기 때문에, 음의 인덱스는 -1부터 시작하고, 마지막 글자부터 거꾸로 붙게 된다.

 

문자열의 슬라이싱

슬라이싱. 자른다는 뜻이다. 문자열을 자르기 위해서는 어디부터 어디까지인지 시작과 끝을 정해야 한다. 그러려면 인덱스를 알고 있어야 한다. 슬라이싱의 문법은 아래와 같다.

문자열의 이름 [a:b]

주의할 점이 있다. 문법을 보면 a부터 b까지 슬라이싱 하는 것 같지만, 사실은 a부터 b-1까지 슬라이싱 하는 것이다. 아래 예를 보자.

0부터 2까지 슬라이싱을 했지만 0번과 1번까지만 데리고 왔다. 음수의 경우도 마찬가지. 앞서 인덱스 번호를 나타냈던 표를 아래와 같이 고치면 슬라이싱을 이해하는 데 도움이 된다.

 

시작 번호를 입력하지 않고 슬라이싱 하면 첫 글자부터 슬라이싱 하고, 끝 번호를 입력하지 않고 슬라이싱 하면 마지막 글자까지 슬라이싱 한다. 그래서 문자열[ : n ] + 문자열[ n : ]은 본래 문자열이 된다.

*주의. 특정 인덱스 위치에 새로운 문자열을 대치하려고 하면 에러가 발생한다. 특정 문자만 바꾸려고 하면 새로운 문자열을 만들어줘야 한다.

 

문자열 길이 함수 len()

len()함수를 활용하면 문자열의 길이를 알 수 있다. 문자열의 길이라는 것은 문자열에 포함된 문자의 개수를 말하는 것이다. 다양한 활용방법이 있겠지만 예컨대, 주민등록번호 13자리인지, 비밀번호의 길이가 허용범위 내에 있는지 등을 확인해야 하는 경우에 활용할 수 있다.

반응형