통계학개론(기초통계학)

[기출문제] 서강대학교 통계학개론 (기초통계학) 2024-2 중간 기출문제 (정답 포함)

상세페이지-메뉴
https://cbt-community.linkareer.com/basic-statistics/5791442

서강대학교 통계학개론 (기초통계학) 2024-2 중간 기출문제 (정답 포함)

 

 

1. 시험 정보

 

학교/과목 서강대학교 통계학개론 (기초통계학)
시험명 2024-2 중간고사 
문항수/형식 객관식 25문제
교수명 이윤동 교수님
정답/해설 ✅ 있음
파일형식 PDF

 

 

 

2. 출제 범위 & 키워드


기초 통계학 및 확률이론 + R 프로그래밍 기초


📚 키워드
모집단·표본, 분산·상관계수, 조건부확률, 베이즈 정리(우도·사후확률), 상자그림(IQR), ggplot2·dplyr 함수, 심슨의 역설

 

 

3. 기출 미리보기

 

 

 

1. 통계적 세계관에서는 세상이 두 개로 구분된다. 그 중 하나로 알고 싶은 대상이기는 하지만 그 대상을 모두 관찰할 수 없는 대상을 무엇이라고 하는가? (4점)
1) 표본 2) 주머니 3) 보자기 4) 모집단 

 

 

 

 

 

4. 자료 보기

 

[기출문제]

 

 

1. 통계적 세계관에서는 세상이 두 개로 구분된다. 그 중 하나로 알고 싶은 대상이기는 하지만 그 대상을 모두 관찰할 수 없는 대상을 무엇이라고 하는가? (4점)
1) 표본 2) 주머니 3) 보자기 4) 모집단 

 

2. 통계적 세계관에서는 세상이 두 개로 구분된다. 그 중 하나로 모두 관찰이 가능한 영역에 속하는 대상을 무엇이라고 하는가? (4점)
1) 모집단 2) 표본 3) 통계 4) 확률


3.서로 독립인 두 확률변수 X와 Y가 있다. X의 표준편차는 5이고 Y의 표준편차는 3이다. 이 때 X−Y의 분산은 얼마인가? (4점) 
1) 16 2) 34 3) 4 4) 6 

4. 상자그림에서 양쪽 수염의 끝점 사이의 거리는 최대 얼마인가? (4점) 
1) 2 IQR 2) 3 IQR 3) 4 IQR 4) 5 IQR 

5. 어떤 동전이 있다. 이 동전을 던지면 2/3의 확률로 앞면이 나오고, 1/3의 확률로 뒷면이 나온다. 이 동전을 30번 던졌다. 처음 던진 20번 중 앞면이 나온 횟수를 X라 하고, 이후 던진 10번 중 뒷면이 나온 횟수를 Y라 하자. 이때 2X−Y의 분산은 얼마인가? (4점) 
1) 40/3 2) 20/3 3) 10 4) 20 

6. 주머니에 검은 공 2개, 흰 공 3개가 들어 있다. 어두운 방에 들어가서 공 두 개를 뽑아서 버린 다음, 세 번째 공을 뽑아 그 공의 색깔을 확인할 때, 이 공이 흰 공일 확률은 얼마인가? 소수 형태로 표현하시오. (4점) 
1) 0.2 2) 0.5 3) 0.6 4) 1.0

7. X, Y, Z는 서로 독립이고, 각각 평균은 0, 분산은 1이다. 이 때 S = X + Y라 하고, T = X − Z라 하자. Cor(S, T)는 얼마인가? (4점) 
1) 1 2) -0.5 3) 0.5 4) -1 

8. 다음 중 잘못된 것은? (4점) 
1) 우도는, 관찰값이 나올 확률에서 관찰값을 고정하여 얻어지는 모수의 함수를 말한다. 
2) 사전확률과 우도가 있으면, 사후확률을 구할 수 있다. 
3) 관찰 결과가 주어진 경우 모수에 대한 확률을 사후확률이라 한다. 
4) 사후확률과 우도의 곱은 사전확률에 비례한다. 


9. R에서, 다음 주어진 보기 문장의 결과는 무엇인가? (4점) 
보기: x = 1:4; x[x > 3] = 0 sum(x) 
1) 1 
2) 3 
3) 4 
4) 6 


10. R의 ggplot2 패키지에서 회귀직선을 그리기 위하여 필요한 함수는? (4점)
 1) geom_smooth 2) geom_lm 3) geom_regression 4) geom_point 


11. 두 변수의 관계가, 제3변수의 고려 여부에 따라 정반대로 달라지는 현상을 무엇이라고 하는가? (4점) 
1) 생태적 오류(Ecological fallacy) 2) 제논의 역설(Zeno’s paradox) 3) 심슨의 역설(Simpson’s paradox) 4) 머피의 법칙(Murphy’s law) 


12. R의 dplyr 패키지에서, 새로운 변수를 만드는 함수는? (4점) 
1) summarize 2) filter 3) mutate 4) arrange 


13. R의 ggplot2 패키지에서, 그림의 scale과 데이터의 변수를 연결하는 함수는? (4점)
1) aes 2) aws 3) arrange 4) filter 


14. R에서 객체 내부를 조회, 구성을 알아보기 위하여 사용하는 함수는? (4점) 
1) ls 2) dir 3) search 4) attributes 


15. 다음 중, R에서 사용자가 정의하는 객체(object)를 저장하는 공간은? (4점) 
1) 데이터 영역 2) GlobalEnv 3) 코드 영역 4) main 


16. 펭귄 데이터 penguins 에서 펭귄의 종류가 아닌 것은? (4점) 
1) Gentoo 2) Chinstrap 3) Versicolor 4) Adelie 


17. R에서 ggplot2를 이용하여 그린 그림이 있다. 이 그림을 그리는 과정에서 사용된 정보를 확인하고자 한다. 다음 중, 이를 위하여 필요한 함수는? (4점) 
1) ggplot_info() 2) ggplot_id() 3) ggplot_search() 4) ggplot_build() 


18. 펭귄데이터 pengs를 이용하여 다음과 같은 그림을 그리려고 한다. 이에 맞는 ggplot2 코드는 무엇인가? (4점) 
1) ggplot2(pengs)+geom_density(aes(bl, col=sp), theta=0.3) 
2) ggplot2(pengs)+geom_density(aes(bl, fill=sp), theta=0.3) 
3) ggplot(pengs)+geom_density(aes(bl, fill=sp), alpha=0.3) 
4) ggplot(pengs)+geom_density(aes(bl, col=sp), alpha=0.3) 


19. R에서 palmerpenguins 패키지의 penguins 데이터에는 결측치들이 포함되어 있다. 이 결측치를 제거하여 pengs 데이터를 만들려고 한다. 이를 위하여 바른 방법은 무엇인가? (4점) 
1) pengs = drop_na(penguins) 
2) pengs = drop.na(penguins) 
3) pengs = na_omit(penguins) 
4) pengs = na.omit(penguins) 


20. R에서 ggplot2를 이용하여 나이팅게일의 장미 그림을 그리고자 한다. 이 과정에서 다음과 같은 그림(A)을 얻었다. 그림(A)를 그림(B)로 만들기 위한 과정으로 타당한 것은? 그림(A)는 R에서 pp라는 이름으로 지정되어 있다. (4점)
1) pp + circular() 
2) pp + make_circular() 
3) pp + coord_polar() 
4) pp + circular_coord() 


21. 다음은 슈뢰딩거 고양이 이야기와 주머니에서 공을 꺼내는 문제에서의 각 구성요소들의 관계를 짝지은 것이다. 바르게 짝지은 것은? (4점) 
1) 외부와 차단된 상자 : 주머니 
2) 고양이 : 추출한 2개의 공 
3) 우라늄 원자 내부 : 주머니 내부 
4) 알파선 방출 : 세 번째 꺼낸 공 


22. 다음 중 바른 설명은? (4점) 
1) John Snow는 1854년 런던에 유행하던 콜레라로 인한 사망 수를 지도에 표시하였다. 
2) 마이켈슨은 간섭계를 개발하여 빛의 속도를 측정하여 미국인 최초로 노벨상을 수상하였다. 
3) R의 sunspots 데이터는 태양의 흑점을 관찰하여 그 개수를 매일 기록한 자료이다. 
4) 나이팅게일은 1854년부터 1856년까지 크림전쟁에서 러시아군 사망자 수를 집계하였다. 


23. 표본을 요약한 값을 무엇이라 하는가? (4점) 
1) 확률 2) 정보량 3) 모수 4) 통계 


24. 다음 중 모수에 해당하는 것은? (4점) 
1) 공정한 주사위에서 짝수가 나올 확률 
2) 펭귄 데이터에서 평균 부리의 길이 
3) 마이켈슨이 측정한 빛의 속도의 평균값 
4) 동전을 10번 던졌을 때 앞면이 나오는 횟수 


25. 다음 중 바른 것은? (4점) 
1) 조건부 분포 f(y|x)와 주변분포 f(y)가 있으면, 주변분포 f(x)를 구할 수 있다. 
2) 이상치가 많은 자료에서 중심값을 알고 싶을 때는 평균보다 중앙값을 사용하는 것이 더 좋다. 
3) 표본상관계수가 1인 경우는, 모든 점들이 기울기가 1인 직선 위에 있을 때이다. 
4) 두 변수의 공분산이 0이면, 두 변수는 독립이다.

 

 

 

 

[정답]

 

 

 

1번 4
2번 2
3번 2
4번 3
5번 4
6번 3
7번 3
8번 4
9번 4
10번 1
11번 3
12번 3
13번 1
14번 4
15번 2
16번 3
17번 4
18번 3
19번 4
20번 3
21번 3
22번 4
23번 4
24번 1
25번 2

 

 

 

추천을 눌러 베스트로 올려주세요!닫기 아이콘
신고하기

사유선택

스크랩 경고

허위 신고의 경우 서비스 이용제한과 같은 불이익을 받으실 수 있습니다.

댓글 1
gsat 시험 배너