ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Python] 파이썬 데이터 타입 (1)
    데이터분석/Python 2023. 3. 21. 11:33

    파이썬에서 사용되는 데이터 타입은 숫자형, 문자열, 불리언, 리스트, 튜플, 딕셔너리, 집합으로 나뉩니다.

    이번 포스팅에서는 숫자형, 문자열, 불리언 타입에 대해 공부해보겠습니다.

     

    숫자형

    숫자형은 말 그대로 숫자로 이루어진 자료형입니다.

    주로 사용하게 될 숫자형은 정수형(int)실수형(float)이 있습니다.

    숫자형은 연산이 가능하다는 특징이 있습니다.

    예를 들어, a가 2라고 하고 b가 10이라고 했을 때, 다음과 같이 연산이 가능합니다.

     

    문자열

    문자열은 문자로 이루어진 자료형을 말합니다.

    문자열은 큰 따옴표(")나 작은 따옴표(')로 둘러 쌓아야 합니다.

    문자열도 연산이 가능한데요!

    '+'를 통해 문자열끼리 연결(더하기)할 수 있고,

    '*'를 통해 문자열을 여러 번 출력할 수 있습니다.

    또한 순서가 있는 순서형 데이터 타입 중 하나로,

    인덱싱(indexing)과 슬라이싱(slicing)이 가능한 데이터 타입입니다.

     

    인덱싱과 슬라이싱

    인덱싱은 문자열의 인덱스 번호를 통해 내가 원하는 글자를 가져오는 거라고 생각하시면 되는데요.

    이때 주의해야 할 점은 파이썬을 포함한 많은 프로그래밍 언어들은

    1부터 시작하는 게 아니라 0부터 시작한다는 점입니다.

    그리고 띄어쓰기도 한 칸으로 생각한다는 점도 기억해야 합니다.

    위 그림에서 알 수 있듯이 인덱스 번호는 음수로도 가능합니다.

    문자열이 너무 길어서 전체 길이를 알기 어려울 때 맨 뒤 글자를 가져오고 싶다면

    '문자열'[-1] 로 접근이 가능합니다.

    인덱스 번호의 시작은 0부터, 맨 뒤는 -1부터라는 거 꼭 기억해주세요!

     

    하지만 인덱싱만으로는 한 글자밖에 가져올 수가 없는데요, 이때 슬라이싱이 사용됩니다.

    슬라이싱은 인덱스 번호의 범위를 통해 내가 원하는 글자를 가져오는 방법입니다.

    바로 예시를 보겠습니다.

    슬라이싱 할 때는 문자열[시작 번호:끝 번호] 와 같은 형태로 작성하면 되는데

    이때 시작 번호를 생략하면 문자열의 맨 처음부터 끝 번호까지,

    끝 번호를 생략하면 시작 번호부터 문자열의 맨 끝까지 출력하게 됩니다.

    또한 슬라이싱에서도 마이너스 기호를 사용할 수 있습니다.

     

    문자열 포맷팅, format, f-string

    문자열을 출력하는 방법은 여러 가지가 있는데 먼저 문자열 포맷팅입니다.

    포맷팅을 하는 이유는 전체적인 틀은 동일한데 특정 부분만 바꿔야 할 때

    전체를 바꾸지 않고 그 부분만 바꾸기 용이하기 때문입니다.

    예를 들어, "오늘 서울의 최저 기온은 5도, 최고 기온은 21도입니다."
    이런 문장이 있다고 할 때, 내일이 되면 최저 기온과 최고 기온이 달라지겠죠?

    이렇게 특정 값을 바꿀 때 문자열 포맷팅을 사용하면 간단합니다.

     

    문자열 포맷팅에 사용되는 코드들을 살펴보면 다음과 같습니다.

    예제를 살펴보겠습니다.

    이렇게 먼저 year, month, day, income을 변수로 만들어두고

    포맷팅을 이용해 문자열을 출력한 예시입니다.

     

    똑같은 예제를 이번에는 format 함수를 이용해서 나타내보겠습니다.

    format 함수 안에 있는 변수들의 순서대로 포맷팅이 된 것을 볼 수 있습니다.

    이렇게 숫자로 표현하지 않고 이름을 사용해 포맷팅하는 것도 가능한데요,

    다음과 같이 표현할 수 있습니다.

    이름을 사용해 포맷팅 할 때는 format 함수 안에 꼭 이름과 값을 매칭한 형태로 넣어줘야 합니다.

     

    다음으로는 f-string에 대해 공부하겠습니다.

    f-string은 문자열 앞에 f를 붙여 미리 선언한 변수를 참조해 문자열을 완성할 수 있습니다.

     

    문자열 관련 함수

    이번에는 문자열에서 사용할 수 있는 몇 가지 함수들을 살펴보겠습니다.

     

    find()는 문자열 중 찾고 싶은 문자의 가장 첫 위치를 알려주는 함수입니다.

    만약 값이 없는 경우, -1을 반환합니다.

    위 예시에서 'Life is too short'에는 'o'가 3번이 나오는데

    가장 처음 나온 위치인 9를 반환하는 걸 볼 수 있습니다.

    또한 이 문장에는 'b'가 없이 때문에 b의 위치를 찾을 땐 -1을 반환하죠.

     

    lstrip(), rstrip()은 문자열 가장 왼쪽과 가장 오른쪽의 공백을 모두 지울 때 사용합니다.

    양쪽 공백을 모두 지우고 싶다면 strip()을 사용하면 됩니다.

    문자열 안에서 어떤 값을 다른 값으로 바꾸고 싶을 땐 replace() 함수를 사용합니다.

    replace(바꾸고 싶은 문자열, 바꿀 문자열) 형태로 사용할 수 있습니다.

    split()은 문자열을 나눌 때 사용하는 함수입니다.

    괄호 안에 아무 것도 넣어주지 않으면 공백을 기준으로 문자열을 나누게 되고,

    split(',')과 같이 괄호 안에 어떤 값이 있다면 그 값을 기준으로 문자열을 나눕니다.

    나눈 값들은 리스트 형태로 반환되는데, 리스트에 대해서는 다음 포스팅에서 공부할 예정이니 참고해주세요!

     

    불리언 (Boolean)

    불리언 자료형은 참(True) 또는 거짓(False)으로 나타나는 자료형입니다.

    아래 예시와 같이 조건문의 반환값으로 나오기도 하고, 변수로 지정할 수도 있습니다.


    이렇게 기본적인 파이썬 데이터 타입에 대해 알아봤습니다.

    다음 포스팅에서는 이어서 파이썬 데이터 타입 중 리스트, 튜플, 딕셔너리, 집합을 공부해보겠습니다.

    '데이터분석 > Python' 카테고리의 다른 글

    [Python] 함수  (2) 2023.03.29
    [Python] 반복문 while문, for문, list comprehension  (2) 2023.03.27
    [Python] 조건문 if  (0) 2023.03.24
    [Python] 변수  (0) 2023.03.22
    [Python] 파이썬 데이터 타입 (2)  (0) 2023.03.21

    댓글

Designed by Tistory.