21.12.13 모의테스트

2021. 12. 13. 21:56작업/데이터분석

# 아래 코드는 문제 해결을 위해 기본적으로 제공되는 코드입니다. 수정하지 마세요!
import numpy as np
np.random.seed(0)

# 지시사항 1번을 참고하여 코드를 작성하세요.
A = np.random.randint(1,20,10)
B = np.random.randint(1,20,10)

def solve():
    # 지시사항 2번을 참고하여 코드를 작성하세요.
    # result = set(a&b)
    a = set(A)
    b = set(B)
    result = set(a&b)
    
    
    # 아래 코드는 문제 해결을 위해 기본적으로 제공되는 코드입니다. 수정하지 마세요!
    return A, B, result


# 값을 확인하기 위한 코드입니다.
result = solve()
print(f'{result[0]}\n{result[1]}\n{result[2]}')

# 아래 코드는 문제 해결을 위해 기본적으로 제공되는 코드입니다. 수정하지 마세요!
import pandas as pd

# ./data/tree_data.csv 파일을 pandas의 DataFrame 형식으로 만들어 변수 tree_df에 저장하세요.
tree_df = pd.DataFrame(pd.read_csv('./data/tree_data.csv'))
# print(tree_df)


# 콩나무 데이터에서 키 (height)값을 확인하고 키를 기준으로 오름차순으로 정렬하여 변수 tree_sort에 저장하세요.
tree_sort = tree_df.sort_values(['height'],ascending=True)
print(tree_sort)

# 키가 가장 작은 콩나무에 대해 모든 컬럼값을 출력하세요.
print(tree_sort.iloc[0])

# 아래 코드는 문제 해결을 위해 기본적으로 제공되는 코드입니다. 수정하지 마세요!
import pandas as pd

# ./data/goods.csv 파일을 pandas의 DataFrame 형식으로 만들어 변수 goods_df에 저장하세요.
goods_df = pd.DataFrame(pd.read_csv('./data/goods.csv'))
print(goods_df)

# 상품 데이터에서 하루 평균 판매량을 확인하고 하루 평균 판매량을 기준으로 내림차순으로 정렬하여 변수 goods_sort에 저장하세요.
goods_sort = goods_df.sort_values('sales', ascending=False)
print(goods_sort)

# 지시사항 3번을 참고하여 코드를 작성하세요.
print(goods_sort.iloc[0]['number'])

# 아래 코드는 문제 해결을 위해 기본적으로 제공되는 코드입니다. 수정하지 마세요!
import pandas as pd
import elice_func

df = elice_func.df

print(df)
# 지시사항을 참고하여 코드를 작성하세요.
def winner(df, n):
    target = df[df['Year']>n]
    # print(target)
    host_country = target['Country'].values.tolist()
    winner_country = target['Winner'].values.tolist() # 그냥 col만 가져오면 Series, .values 속성을 붙이면 tolist() 사용 가능
    print(host_country)
    H = set(host_country)
    W = set(winner_country)
    result = set(H & W)
    print(result)
    final_result = [x for x in result]
    return final_result

# 값을 확인하기 위한 코드입니다. 값을 변경해가며 테스트해 보세요!
print(sorted(winner(df, 1980)))

# 아래 코드는 문제 해결을 위해 기본적으로 제공되는 코드입니다. 수정하지 마세요!
import pandas as pd


# data.csv파일을 pandas의 DataFrame 형식으로 만들어 변수 df에 저장하세요.
df = pd.DataFrame(pd.read_csv('data.csv'))
print(df)


# 자주 사용하는 SNS와 성별로 그룹을 지은 다음, 그룹별로 연령대의 평균을 구해 변수 df2에 저장하세요.
df2 = df.groupby(['sns','gender']).mean()


# 아래 코드는 문제 해결을 위해 기본적으로 제공되는 코드입니다. 수정하지 마세요!
print(df2)

# 아래 코드는 문제 해결을 위해 기본적으로 제공되는 코드입니다. 수정하지 마세요!
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

from elice_utils import EliceUtils

elice_utils = EliceUtils()

# 지시사항 1번을 참고하여 코드를 작성하세요.
goods_df = pd.DataFrame(pd.read_csv('./data/goods.csv'))
# print(goods_df)

# 상품 데이터에서 가격을 확인하고 가격을 기준으로 내림차순으로 정렬하여 상위 10개 데이터만 추출해 변수 goods_sort에 저장하세요.
goods_sort = goods_df.sort_values('price',ascending=False).iloc[:10]
print(goods_sort)
print(len(goods_sort))
# (xxx 축: np.arange(10), yyy 축: 가격)
fig1, ax1 = plt.subplots()
plt.plot(np.arange(10),goods_sort['price'])

# 지시사항 3.B를 참고하여 코드를 작성하세요.
fig2, ax2 = plt.subplots()
plt.bar(np.arange(10),goods_sort['price'])

# 지시사항 3.C를 참고하여 코드를 작성하세요.
fig3, ax3 = plt.subplots()
plt.scatter(np.arange(10),goods_sort['price'])

# 그래프를 확인합니다. 수정하지 마세요!
fig1.savefig('fig1.png')
fig2.savefig('fig2.png')
fig3.savefig('fig3.png')
elice_utils.send_image('fig1.png')
elice_utils.send_image('fig2.png')
elice_utils.send_image('fig3.png')