반응형

전체 글 72

[머신러닝] Decision Tree(결정트리) [스마트인재개발원]

Decision Tree(결정트리) Tree를 만들기 위해 예/아니오 질문을 반복하며 학습 분류와 회귀에 모두 사용가능 타깃 값이 한개인 리프 노드를 순수노드라고 한다. 모든 노드가 순수 노드가 될때 까지 학습하면 복잡해지고 과대적합이 된다. 새로운 데이터 포인트가 들어오면 해당하는 노드를 찾아 분류라면 더 많은 클래스를 선택하고, 회귀라면 평균을 구한다. Decision Tree(결정트리) 과대적합 제어 사전 가지치기(pre-pruning) : 노드 생성을 미리 중단하는 방법 사후 가지치기(pruning) : 트리를 만든후에 크기가 작은 노드를 삭제하는 방법 트리의 최대깉이나 리프 노드의 최대 개수를 제어 노드가 분할 하기 위한 데이터 포인트의 최소 개수를 지정 주요 매개변수(Hyperparameter..

[JS] 자바스크립트 함수 사용, DOM

자바 스크립트에서 함수 선언 방식 function 함수명 ( 매개변수1, 매개변수2, ..){ 기능 구현을 위한 코드 작성 } 함수명(입력값1, 입력값2, ....); 로 함수를 사용한다. 함수가 결과값을 반환하는 경우 자바처럼 return으로 반환한다. 자바스크립트 함수 특징 매개변수와 입력값의 데이터 타입이 동일한지 검사하지 않는다. 이유: 데이터 타입을 지정하지 않아서 매개변수와 입력값의 개수가 같은지 검사하지 않는다. 이유: 내부적으로 arguents객체가 호출되어 인자들을 배열형태로 저장한다. 입력값의 개수가 매개변수의 개수보다 적다면 매개변수의 값은 undefined로 설정된다. (자바스크립트 자료형 참고) 객체(Object) 객체지향 프로그래밍에서 데이터(속성)과 그 데이터에 관련되는 동작(..

HTML\CSS\JS 2021.06.10

[JS] 자바스크립트 배열

배열(array) : 같은 타입의 여러 변수를 하나의 묶음으로 다루는것 인덱스와 인덱스에 대응하는 데이터들로 이루어진 자료구조 - 배열에 데이터를 추가할 때 자동으로 공간이 할당된다. 자바스크립트의 배열은 모든 타입을 저장할 수 있는 구조 - 한배녈의 요소가 모두 같은 타입일 필요는 없음 - 다른 배열이나 객체 포함 배열 인덱스 - 인덱스는 배열의 시작 위치에서부터 데이터가 있는 상대적인 위치(0부터 시작) 자바스크립트에서의 배열선언 방식은 2가지가 있다. len nameList = []; let nameList = new Array(); 가로안에는 자바처럼 데이터를 몇개 할당할건지 숫자를 적는다. 자바 스크립트의 배열 크기는 동적이다. 배열의 크기가 지정되어 있어됴 데이터를 추가하면 저장공간이 자동으로..

HTML\CSS\JS 2021.06.08

[JS] 자바스크립트 변수선언과 연산자, 형변환, 조건문, 반복문[스마트인재개발원]

자바 스크립트에서는 일반적으로 변수를 var로 선언한다. 변수의 의미 사전적의미는 "변화를 줄수있는" 또는 "변할 수 있는 수" 프로그래밍에서의 의미는 데이터를 담을 수 있는 공간이다. 자바에서 변수는 var, let으로 선언하고 상수는 const로 선언한다. 변수 재선언 재할당 var 가능 가능 let 불가능 가능 const 불가능 불가능 변수의 재선언이란 var name = 10; 이렇게 선언하고 또다시 var name = 5; 로 선언하면 재선언이고 변수의 재할당이란 var name = 10; name = 5; 로 쓰면 재할당이다. 자료형 설명 number 정수,실수등 산술연산이 가능한 자료형 string 문자열로 이루어진 자료형 boolean 참/거짓으로 표현되는 논리 형태의 자료형 undefin..

HTML\CSS\JS 2021.06.08

[JS] JavaScript 기본개념 과 웹페이지에 입력문과 출력문 띄우기 [스마트인재개발원]

JavaScript 웹 페이지를 동적으로, 프로그래밍적으로 제어하기 위해서 고안된 언어다. 모든 웹 브라우저에서 동작한다. 웹 브라우저에서 실행 결과를 즉시 확인한다. 다양한 용도의 프로그램 개발 다양한 자바스크립트 공개 API 다양한 라이브러리와 프레임워크 웹페이지를 만들때 JavaScript를 가장 많이 사용한다. 그리고 최근에 JavaScript 기반인 TypeScript도 크게 증가하는 추세이다. 따라서 JavaScript를 배워두면 웹페이지를 개발할때 많이 도움이 될거다. HTML내에서 자바스크립트를 쓰려면 을 쓴후 그안에 코드를 작성해야한다. 내부방식은 검사에서 다보이기 때문에 다른사람들이 접근하기 쉬워서 회사 내에서나 쓰지 그밖에는 외부 방식을 사용한다. 인라인 방식은 접근은 간단하지만 코드..

HTML\CSS\JS 2021.06.08

[머신러닝] KNN을 이용한 비만도 분석

import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets import load_iris # sklearn에서 제공하는 붓꽃 데이터 from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.linear_model import LinearRegression 1. 문제정의 500명의 키와 몸무게, 비만도 라벨을 통해서 비만을 판단하는 모델을 만들어보자2. 데이터 수집 2. 데이터 수집 data = pd.read_csv('bmi_500.csv', index_col = "Label" #La..

[웹 크롤링] Gmarket 100 가져오기로 창없는 크롤링하기

먼저 Gmarket에서 인기순위 1위인 상품의 상품명, 가격, 카테고리 정보를 가져와 보자. from selenium import webdriver as wb import pandas as pd import time driver = wb.Chrome() url = "http://corners.gmarket.co.kr/Bestsellers" driver.get(url) # 단수, 복수 잘보자! # elements 복수는 list로 가져와짐 # no1인 상품 클릭! div = driver.find_element_by_css_selector("p#no1 + div") div.click() itemTitle = driver.find_element_by_css_selector("h1.itemtit") itemPr..

[Data Science] 큰데이터 프레임/큰 시리즈를 살펴볼때 도움이 되는 함수

큰 데이터프레임을 살펴볼때 데이터프레임.shape 데이터프레임의 행과 열수를 알수있다. (행수, 열수) 데이터프레임.columns 어떤 컬럼들이 있는지 확인할수있다. 데이터프레임.info() 각 컬럼들의 기본 정보를 한눈에 볼수있다. 데이터프레임.describe() 각 컬럼들에 대한 기술통계정보를 보여준다. 데이터프레임.sort_values(by="") by값을 기준으로 정렬한다. ascending = False를 하면 내림차순으로 정렬된다. 디폴트는 오름차순 inplace = True를 해야 정렬된 값이 원본에 저장된다. 디폴트는 False다. 큰 시리즈를 살펴볼때 .unique() 중복되는 값을 뺀 값만 보여준다. .value_counts() 몇개인지 횟수를 세준다. .describe() 시리즈 요약값

[Data Science] pandas라이브러리 정리

pandas 라이브러리 데이터 조작 및 분석을 위한 라이브러리 Series Class : 1차원 :인덱스 + 값 DataFrame Class : 2차원 :행과 열을 가지는 표와 같은 형태 :서로 다른 종류의 자료형을 저장 할수있음 import pandas as pd로 임폴트하고 보통 pd로 불여부른다. import pandas as pd Series 사용(1차원) list1 = [996231, 654615, 452305, 44645] city = ['서울', '부산', '인천', '대구'] population = pd.Series(list1, index = city) population Series 값, 인덱스, 데이터 타입 확인 population.values # 값 확인 population.index..

반응형