본문 바로가기

카테고리 없음

빅데이터 수집시스템 개발

반응형
1번 문제.
클립보드 기능을 메서드로 제공하는 모듈명은?
re
numpy
pandas
pyperclip (정답)
해설
클립보드 기능을 메서드로 제공하는 모듈명은 pyperclip입니다. re는 정규 표현식, numpy는 배열, pandas는 데이터 프레임 관련 기능을 제공하는 모듈입니다.
2번 문제.
Rest API로 정보 요청 시 요청 목적에 알맞게 name=value 형식의 Query 문자열을 하나 이상 추가하는 경우 각각의 name=value를 구분하는 문자는?
& (정답)
+
#
:
해설
name=value 형식의 Query 문자열을 구성할 때 여러 개의 name=value를 구분하는 문자는 &입니다.
3번 문제.
다음 중 토큰을 분리하려고 할 때, 적당한 함수는?
index
isdecimal
strip
split (정답)
해설
토큰을 분리하기 위해서는 split 함수를 사용합니다.
4번 문제.
빅데이터 처리 언어로서 파이썬에 대한 설명 중 옳지 않은 것은?
이해하기 쉽고 유연한 문법으로 좋은 접근성을 가진다.
빅데이터 처리 언어로서 많은 커뮤니티가 형성되어 있다.
가독성이 좋고, 간결하며, 스탠다드 라이브러리가 잘 갖춰져 있다.
데이터 분석 관련 패키지가 최근 몇 년 사이 눈에 띄게 발전하여 데이터 분석 관련 오픈 소스 라이브러리들을 유상으로 사용할 수 있다. (정답)
해설
데이터 분석 관련 패키지가 최근 몇 년 사이 눈에 띄게 발전하여 데이터 분석 관련 오픈 소스 라이브러리들을 무상으로 사용할 수 있습니다.
5번 문제.
msg = [“I”, “like”, “star”]라는 토큰 리스트가 있을 때 모든 토큰을 결합하여 하나의 문자열로 만들 수 있는 함수는?
join (정답)
append
concatenation
add
해설
join 함수를 이용해서 토큰들을 하나로 묶을 수 있습니다.
6번 문제.
KoNLPy를 활용한 한국어 형태소 분석에 대한 설명 중 옳지 않은 것은?
KoNLPy 라이브러리에는 형태소 분석을 위해 지원하는 클래스가 여러 개 있다.
Hannanum Class는 사용 가능하다.
Komoran Class는 현재 파이썬 버전에서는 작동하지 않는다.
MeCab Class는 Window 7에서 지원한다. (정답)
해설
MeCab Class는 Window 7에서 지원하지 않습니다.
7번 문제.
다음 데이터에서 누락 데이터를 찾고자 할 때 함수를 바르게 적용한 경우는?
data[‘height’].isnull().sum() (정답)
data[‘height’].NaNsum()
data[‘height’].CountNan()
data[‘height’].CntNa()
해설
isnull() 함수와 sum() 함수를 호출합니다.
8번 문제.
Pandas 라이브러리에 대한 설명 중 옳지 않은 것은?
콘솔 창에서 pip install Pandas라고 입력하면 설치가 된다.
클래스와 여러 가지 내장함수로 구성되어 있다.
클래스를 별도로 만들어 데이터를 읽고 쓸 수 있다. (정답)
csv 파일을 읽고 쓰거나, Excel 파일을 읽고 쓰기 쉽도록 구성되어 있다.
해설
Pandas 라이브러리는 클래스를 별도로 만들지 않고도 데이터를 읽고 쓸 수 있습니다.
9번 문제.
네이버의 블로그 및 뉴스 등의 검색 서비스 API를 이용하여 데이터를 수집할 때 옳지 않은 것은?
네이버의 검색 서비스 요청은 비로그인 오픈 API이다.
발급받은 Client ID와 Client Secret 정보를 Query 문자열에 담아 전달한다. (정답)
XML 형식의 응답과 JSON 형식의 응답을 선택할 수 있다.
네이버의 검색 서비스 Open API는 Rest API 형식이다.
해설
발급받은 Client ID와 Client Secret 정보를 정해진 이름과 함께 Http 헤더에 담아 전달해야 합니다.
10번 문제.
Anaconda에 대한 설명 중 옳지 않은 것은?
파이썬 개발 환경과 수학·과학·데이터 분석 분야에서 필요한 거의 모든 패키지가 포함되어 있다.
CONDA라는 응용 프로그램을 제공하여 패키지 및 환경 관리를 편리하게 처리하도록 지원한다.
1991년에 첫 버전이 공개된 후 지금까지 많은 인기를 얻고 있는 스크립트 형태의 범용 프로그래밍 언어이다. (정답)
데이터 과학 및 머신 러닝을 위한 파이썬과 R 프로그래밍 언어의 ‘Freemium’ 오픈 소스를 배포한다.
해설
1991년에 첫 버전이 공개된 후 지금까지 많은 인기를 얻고 있는 스크립트 형태의 범용 프로그래밍 언어는 파이썬입니다.
11번 문제.
다음 시각화에 대한 설명 중 옳지 않은 것은?
파이썬과 웹 프로그램 언어인 JavaScript를 지원한다.
파이썬에서도 워드클라우드를 지원하는 라이브러리가 여러 종류이다.
데이터의 단어와 단어의 빈도 수를 튜플로 묶어 리스트 형태로 전달해야 한다. (정답)
텍스트 데이터를 전달하면 워드클라우드를 만들어서 다운받게 해주는 웹 사이트도 있다.
해설
데이터의 단어와 단어의 빈도 수를 튜플로 묶어 리스트 형태로 전달해야 하는 것은 pytagcloud 라이브러리입니다.
12번 문제.
urllib.parse.urlparse("URL문자열")을 사용하여 ParseResult 객체를 생성한 후에 도메인 정보를 추출하는 용도로 사용되는 속성명은?
path
netloc (정답)
query
port
해설
path는 요청 대상의 디렉토리와 파일명을, query는 함께 전달되는 Query 문자열을, port는 포트번호를, netloc은 요청하려는 웹 서버의 도메인 정보를 추출합니다.
13번 문제.
다음 중 웹 페이지를 구성하는 기술이 아닌 것은?
CSS
DataBase (정답)
JavaScript
HTML
해설
웹 페이지의 내용과 구조는 HTML, 스타일은 CSS, 웹 페이지의 동적인 처리는 JavaScript 기술이 사용됩니다. DataBase는 서버에서 데이터를 저장하고 관리하는 용도로 사용됩니다.
14번 문제.
다음 중 timestamp에 대한 설명으로 옳지 않은 것은?
timestamp는 유닉스/리눅스 계열에서 사용하는 시간을 나타내는 정수이다.
1970년 1월1일 0시 0분 0초부터 몇 초가 지났는지를 나타내는 정수값이다.
이 타임스탬프는 지구 자전축의 움직임을 고려하는 윤초(Leap Second)까지 반영하여 엄격하게 정의한 숫자이다. (정답)
단순히 하루를 86400초로 계산하여 순차적으로 증가시킨 것이다.
해설
timestamp는 엄격하게 정의한 숫자가 아닌 단순히 하루를 86400초로 계산하여 순차적으로 증가시킨 것입니다.
15번 문제.
다음 설명 중 옳지 않은 것은?
파이썬에서 데이터셋 관리를 위해 Pandas 라이브러리를 제공한다.
머신러닝 또는 딥러닝은 1차원 구조의 데이터를 이용해 스스로 학습하고 미래의 상황을 예측할 수 있다. (정답)
데이터 분석을 위해 파이썬에서 기존에 사용하던 타입인 list, dict 등을 그냥 사용할 수 없다.
Pandas 라이브러리는 클래스를 별도로 만들지 않고도 데이터를 읽고 쓸 수 있다.
해설
머신러닝 또는 딥러닝은 2차원 구조의 데이터를 이용해 스스로 학습하고 미래의 상황을 예측할 수 있습니다.
16번 문제.
KoNLPy에 대한 설명 중 옳지 않은 것은?
고유명사 추출에 유용하다. (정답)
기본 사전으로 세종말뭉치를 사용한다.
사용자 사전 등록이 가능하나 오류가 많다.
품사 태깅, 내부에 Twitter, Kkma, Hannanum 등 형태소 분석기를 사용한다.
해설
고유명사 추출에 유용한 분석툴은 SoyNLP입니다.
17번 문제.
strftime함수를 사용하여 오늘 날짜를 2019-10-20 October의 형태로 출력할 때 사용하는 서식으로 옳은 것은?
%Y-%M-%D
%Y-%M-%D %B
%Y-%m-%d %B (정답)
%Y-%m-%d %h
해설
연-월-일과 월이 영어로 나왔으므로 %Y-%m-%d %B를 사용합니다.
18번 문제.
goods_name.goods_icon이라는 클래스 속성을 갖는 p태그의 첫번째 레벨의 자식 태그 a를 찾고자 할 때, 선택자로 옳은 것은?
p#goods_name.goods_icon > a
p.goods_name.goods_icon a
p#goods_name.goods_icon > a
p.goods_name.goods_icon > a (정답)
해설
클래스 선택자와 자식 선택자를 사용해야 합니다. 클래스 선택자는 . 기호를 사용하며 자식 선택자는 > 기호를 사용합니다.
19번 문제.
링크를 클릭하는데 URL이 변경되지 않는다면 Selenium을 이용한 크롤링을 고려해야 한다.
O (정답)
X
해설
링크를 클릭하는데 URL이 변경되지 않는다면 JavaScript로 요청하거나 Selenium을 이용한 크롤링을 고려해야 합니다.
20번 문제.
문자열을 여러 줄에 걸쳐 써야 할 경우 큰따옴표를 2개 쓰거나 작은따옴표를 2개 쓰면 된다.
O
X (정답)
해설
문자열을 여러 줄에 걸쳐 써야 할 경우 큰따옴표를 3개 쓰거나 작은따옴표를 3개 써야 합니다.
728x90
반응형