2021년 4월 5일 월요일

AITech P-stage1 [Day 6] 데이터 시각화, 아직 python IDLE로 만드는 중..

 

==============================

수업내용


시각화를 진행할 데이터

1. 데이터셋 관점 (global)

2. 개별 데이터의 관점 (local)


정형데이터는 평소에 보던 csv, tsv. item, attribute, cell.

통계적 특성과 feature 사이 관계, 데이터 간 관계, 데이터 간 비교.


시계열데이터는 시간 흐름에 따른 데이터.

기온, 주가등의 정형데이터와 음성, 비디오 같은 비정형 데이터 존재.

시간 흐름에 따른 추세(Trend), 계절설(Seasonality), 주기성(Cycle) 등을 살핌.


지리/지도 제이터

거리, 경로, 분포등.


관계 데이터

Graph visualization / Network Visualization

객체는 Node로, 관계는 Link로


계층적 데이터

포함관계가 분명한 데이터

Tree, Treemap, Sunburst


수치적 데이터

수치형(numerical) 안에 연속형(continuous), 이산형(discrete)

범주형(categorical) 안에 명목형(norminal), 순서형(ordinal)



마크와 채널 (mark and channel)

딱히 주의를 주지 않아도 구분할 수 있는 특징. 시각적 분리 (visual popout)



실습

https://colab.research.google.com/drive/1DWqDZPUnuMWQwyBleYk6vvKW_W7p3c5h?usp=sharing

정말 정말 정말 정말 좋다. 기본에 충실한 plt.





================================

피어세션

oversampling

val을 다 일정비율로 맞춰서.

ffhq 사람얼굴 데이터셋, 쓸수있는거 900개.

efficientnet이 짱. resnet18 보다도.

==================================

목표

주말에 IDLE 만들던거 다 만들기


=========================

행동

예시코드로 준거는 거의 다 구현했는데 그 이후에 문제다. 모델 훈련한거 불러와서 csv로 저장하는거.

======================

회고

코딩에 생각보다 시간이 너무 오래 걸린다.

나도 15시간 공부 해보기를 해야되나..

댓글 없음:

댓글 쓰기