본문 바로가기

728x90
반응형

분류 전체보기

(304)
[실습문제] 2023. 12. 8.(금) (2문제) 1. subway2.csv 파일을 읽고 승차가 가장 많은 top5역에 대해 시간대별 승차인원에 대한 변화를 표현한 5개 역의 그래프를 출력하여라. 2. 병원현황.csv 파일을 읽고, 1) 연도별 병원수가 가장 많은 표시과목을 확인하여라. Line 3의 View 함수를 사용하면 아래 사진처럼 엑셀 형식의 자료구조를 확인할 수 있다. 2) 연평균 병원수 기준 각 상위 5개 표시과목에 대해 각 표시과목의 연도별 병원 증감추이를 선그래프로 비교하여라.
10일차 - [1일 1문제] 업무가 MANAGER 인 사람의 정보 조회(SQL) 1. EMP, DEPT 테이블에서 업무가 MANAGER인 사원의 이름, 업무, 부서명, 근무지를 조회하여라(인라인뷰).
[복습] R(programming language) 시각화(1)(선그래프) + 하루끝(20231208) 시각화에는 기본 시각화 함수와 ggplot2 패키지가 있다. 우선 기본 시각화 함수로 여러 그래프를 출력해보도록 하겠다. 1. 선 그래프(산점도): 분포를 확인하거나 x축과 y축의 상관관계를 시각화하는 기법 중 하나로, 고른 분포를 띄는지, 특정한 분포를 보이는지, x와 y가 어떤 관계를 보이는지 등을 알 수 있다. plot(x, # x축 좌표 y= NULL, # y축 좌표 type ='p', # 그래프 타입(p: 산점도, l: 선그래프, ....) xlim = NULL, # x축 좌표 범위(예: 1~100중 50~60만 보고 싶을 때) ylim = NULL, # y축 좌표 범위(예: 1~100중 50~60만 보고 싶을 때) log = '', # y축 좌표를 log로 쓸 것인가 main = NULL, #..
[실습문제] 2023. 12. 7.(목) (1문제) 1. 교습현황.csv 파일을 읽고 1) 교습과정별 연도별 매출 총액 확인 2) 교습과정별 월별(연도 상관없이) 매출 총액 확인 → 1월에서 12월 12개 그룹 리턴 3) 교습과정별로 매출이 가장 높은 월 확인 4) 교습과정별 구별 2016~2018 매출 총 합 기준 가장 매출이 높은 교습소명 출력 5) 교습과정별로 2016~2018 매출 총 합 기준 가장 매출이 높은 동이름 출력
2022년 4월 24일 필기 기출문제(풀이중) 1과목: 소프트웨어 설계 1. UML(Unified Modeling Language): 시스템 분석, 설계 구현 등 시스템 개발 과정에서 시스템 개발자와 고객 또는 개발자 상호간의 의사소통이 원활하게 이루어지도록 표준화한 대표적인 객체지향 모델링 언어 - 6개의 구조 다이어그램(시스템 구조 표현) 1) 클래스 다이어그램(class diagram) 2) 객체 다이어그램(object diagram) 3) 컴포넌트 다이어그램(component diagram) 4) 배치 다이어그램(deployment diagram) 5) 복합체 다이어그램(composite structure diagram) 6) 패키지 다이어그램(package diagram) - 7개의 행위 다이어그램(시스템 동작 표현) 1) 유스케이스 다이어..
9일차 - [1일 2문제] 소속 부서의 평균보다 많은 급여 받는 사원 찾기(SQL) 1. 상호연관 서브쿼리 2. 인라인뷰 오랜만에 성능비교 해봐야겠다. 상호연관 서브쿼리는 Buffers가 12가 걸렸다. 인라인뷰는 6이 걸렸다.
9일차 - [1일 1문제] 시퀀스 작성하기(SQL) 1. SCOTT 소유의 HONG_SEQ 이름으로 시퀀스를 작성하려 한다. 100부터 1000까지의 값을 갖도록 설정하고 1000이 되면 더이상 값을 할당 받을 수 없도록 한다. 시퀀스 할당의 부하를 줄이기 위하여 메모리에 10개의 값을 미리 올려놓을 수 있도록 설정한다. 2. 모든 계정에서 1번에서 생성한 시퀀스를 HONG_SEQ 이름으로 사용할 수 있도록 설정하여라.
[복습] R(programming language)의 파일 입출력 + 하루끝(20231207) 1. read.csv: , 로 분리 구분된 파일을 불러오는 함수(데이터프레임으로 리턴) - sep = ',' : 분리구분기호 - header = T : 첫 번째 행을 컬럼화할지의 여부 - skip : 스킵할 행의 수 - nrow : 불러올 행의 수 - na.strings : NA처리할 문자열 - fileEncoding : encoding 형식 예) NA 처리할 문자열 전달 전/후 비교 2. read.table: 공백이나 탭으로 분리된 파일을 불러오는 함수(데이터 프레임으로 리턴) - sep = '' - header = F 3. scan : 벡터로 외부 파일을 불러옴 scan(file = '', # 파일명(생략 시 사용자가 직접 입력) what = '', # 문자형 데이터를 불러올 경우 빈 문자열 전달 필..
[복습] R(programming language) 데이터 구조 변경(long, wide) (2) 데이터 구조 변경에 대하여 어제 배운 내용에 복습 및 이어서 작성하려고 한다. https://metime.tistory.com/162 [복습] R(programming language) 데이터 구조 변경(long, wide) + 하루끝(20231206) 1. 데이터의 분류 1) long data(=tidy data) - rdbms의 데이터 형식이다(relationshop dbms). 하나의 속성별로 컬림이 된다. 여기서 속성이란 하나의 관찰 대상으로 데이터로 표현할 수 있는 값을 의미한다. 예 metime.tistory.com 1. 데이터 분류 1) long data(=tidy data) - rdbms의 데이터 형식으로 하나의 속성이 하나의 컬럼이 되는 형식이다. - join / group by 연산이 ..
[복습] R(programming language) 데이터 구조 변경(long, wide) + 하루끝(20231206) 1. 데이터의 분류 1) long data(=tidy data) - rdbms의 데이터 형식이다(relationshop dbms). 하나의 속성별로 컬림이 된다. 여기서 속성이란 하나의 관찰 대상으로 데이터로 표현할 수 있는 값을 의미한다. 예를 들어 성별 ,성적, 연도 등이 되겠다. 왜 하나의 속성으로 컬럼을 만드는 것일까? 이는 join이 가능하며 group by에도 어울리기 때문이다. 2) wide data(=cross data) - 요약정보(직관적), 행별, 열별 연산이 용이하다. - 그러나 join이 불가하며 컬럼 변형이 잦다(컬럼의 추가, 삭제 발생). 예를 들어 연도가 늘어날 때마다 컬럼을 추가하는 방식은 데이터 관리에 있어 비효율적인 방식이다. 그리고 DBMS에서 계속 컬럼이 추가 된다는 ..

728x90
반응형