- ๋ฐ์ดํฐํ๋ ์ ์ปฌ๋ผ
str
ํ์
๋ณ๊ฒฝ
# ํ ์ปฌ๋ผ์ ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ผ์ด์ฑํ์ฌ ์๋ก์ด ์ปฌ๋ผ์ ๋ง๋ค์ด๋ด๋ ค ํ๋๋ฐ
# ๋ ๋ฒ์งธ ๊ฐ๊น์ง ์ฌ๋ผ์ด์ฑํ๋ ค ํ๋๋ฐ, 'intํ์
`์ ์ฌ๋ผ์ด์ฑ์ด ๋์ง ์๋๋ค.
# ๊ฐ์ ์ ๋ฌํ ์๋ณธ ์ปฌ๋ผ์ `object`ํ์ด๋ค
data['new_column'] = data['old_column'].astype('str')
data['new_column'] = data['new_column'].str.slice(start=0, stop=2)
- ๋ฐ์ดํฐํ๋ ์
int
ํ์ผ๋ก ์ด๋ฃจ์ด์ง ๋ฐ์ดํฐ์์ NaN
์ด ์์ผ๋ฉด float
ํ์ผ๋ก ํ์ถ๋๋ค๊ณ ์ฃผ์๋ค์๋ค. ์ง์ง ๊ฐ?
test = {'a':[1,2,3,4,5,np.nan,6,7,8,9], 'b':[1,2,3,4,5,6,7,8,9,10]}
test = pd.DataFrame(test)
>>> display(test['a'].dtype)
dtype('float64')
>>> display(test['b'].dtype)
dtype('int64')
- ๋ฆฌ์คํธ ๊ฐ์๋ณด๋ค ํฐ ๊ฐ์ ์ฌ๋ผ์ด์ฑ ํ ๊ฒฝ์ฐ
# web crawling์ payload์์ item_ids๋ฅผ ๊ฐ์ ธ์์ผ ํ๋๋ฐ
# 1000๊ฐ์ด์์ ๋ฐ์ดํฐ๋ 990~1000๊ฐ๊น์ง item_ids ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ฌ ์ ์์ด์
# 900๊ฐ์ฉ ๋์ด์ ๊ฐ์ ธ์ค๋ ๊ฒฝ์ฐ๊ฐ ์์๋ค
>>> list1 = list('abcdefg')
>>> list1[:90]
['a', 'b', 'c', 'd', 'e', 'f', 'g']
# ์ฌ๋ผ์ด์ฑ ๊ฐ์ด ์ปค๋ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ค๋๊ฒ์ ํฐ ๋ฌธ์ ๋ ์์๋ค
>>> list = [[] * 5]
>>> list
[[]]
>>> list = [] * 5
>>> list
[]
>>> list = [[0] * 5]
>>> list
[[0, 0, 0, 0, 0]]
>>> list1 = [[0]] * 5
>>> list1
[[0], [0], [0], [0], [0]]