의료 부분의 데이터는 구하기 힘들다 데이터 분산 - Spark 웹 크롤링, 데이터베이스, 웹 프로그래밍 크롤링 예시 쇼핑몰 데이터 크롤링, 이미지 크롤링, 네이버 주식 데이터 크롤링 등 클래스의 개념 cpu , ram, sdd(hdd) - 컴퓨터의 구조 1. 변수선언 : 메모리를 사용한다. 메모리에 데이터를 할당 및 저장공간 구별을 위해 식별자를 넣는다 2. 데이터 타입 : 메모리를 효율적으로 사용한다 : int,float,bool,str,list,tuple,dict,set 등 3. 연산자 : cpu 사용 문법(ALU) : 산술, 비교, 논리, 할당, 멤머 등.4. 조건문, 반복문 : 컴퓨터가 자동으로 판단하게 해주고, 똑같은 코드를 반복하지 않게 효율을 높여준다.if,else,while,for,brea..
목표 pandas를 활용하여 데이터의 생성, 조회, 변경, 및 삭제. Open API가 제공하는 JSON 형식의 데이터를 pandas DataFrame으로 변환 CRUD 데이터의 생성, 조회, 수정, 삭제를 일컫는 말 Create, Read, Update, Delete -> CRUD DataFrame을 목적에 맞게 변경하여 다루는 게 중요하다. 열을 생성하거나, DataFrame안의 값을 업데이트 하거나, 행을 제거하거나 하는 일을 실행한다. DataFrame의 인덱스 loc 인덱서를 이용하여 원하는 데이터 조회(불리안 인덱싱 및 일반 조회) OpenAPI를 이용한 데이터 수집 공공데이터 포털, 영화진흥위원회 불러 올 때 가장 인기 있는 형식은 Json. JSON은 파이썬의 딕셔너리와 굉장히 비슷하게 생..
10진법을 N 진법으로 변환하는 가장 기본은 해당 수로 몫과 나머지를 구해나가며, 나중에 나머지를 역순으로 붙인다는 것이다. python에서는 int 함수나 hex, bin 같은 내장 함수로 10진수를 2,8,16 진수로 바꿀 수 있고, n 진수에서 10진수로 바꾸는 것도 가능하다. 하지만 10진법을 n진법으로 바꾸기 위해서는 따로 설정해주는 함수가 필요한데, 이는 다음과 같다. import string tmp = string.digits+string.ascii_uppercase+string.ascii_lowercase #진수 변환 함수 print(tmp) def convert(num, base) : q, r = divmod(num, base) #몫과 나머지를 구한다. if q == 0 : return ..
프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 문제 해결을 위한 고민 얼핏 보고 DFS를 고려했으나, 삼각형의 높이가 500개라는 걸 보고 감이 왔다. 이건 DFS로 풀면 안된다고. 만약 DFS로 풀면 어떻게 될까? 경우의 수를 따져보면, DFS로 완전탐색하는데 걸리는 횟수는 1줄일 때 1번, 2줄일때 2번, 3줄일 때 4번, 4줄일 때 8번...이런 식으로 2^(n-1)가 된다. 500줄이면 2^499= 1,636,695,303,948,071,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,00..
https://www.acmicpc.net/problem/1259 1259번: 팰린드롬수 입력은 여러 개의 테스트 케이스로 이루어져 있으며, 각 줄마다 1 이상 99999 이하의 정수가 주어진다. 입력의 마지막 줄에는 0이 주어지며, 이 줄은 문제에 포함되지 않는다. www.acmicpc.net 풀이 팰린드롬으로 판단하려면 간단하게 앞쪽의 수와 맨 뒤쪽의 수를 비교하면서 가면 된다. 코드로 직관적으로 쉽게 짜면 다음과 같다. import sys li = list(map(int,sys.stdin.buffer.read().rstrip().split())) for i in li: if i==0: break i=str(i) a=0 #첫번째 수의 인덱스 b=-1 #마지막 수의 인덱스 while len(i)!=a:..
15829번: Hashing APC에 온 것을 환영한다. 만약 여러분이 학교에서 자료구조를 수강했다면 해시 함수에 대해 배웠을 것이다. 해시 함수란 임의의 길이의 입력을 받아서 고정된 길이의 출력을 내보내는 함수로 정 www.acmicpc.net 풀이 상당히 특이한 문제이다. 경우에 따라 50점이 나올 수도 있는 문제이다. 50점이 나오는 경우에는 파이썬이 아닐 때는 int의 범위 문제이다. long long을 써서 해결해야 한다. 만약 python이라면 범위는 문제가 없다. 정확히는 너무 큰 수는 출력하는 데 힘들어서 50점을 주는 것이다. 따라서 나머지를 M(문제에서는 1234567891)으로 나눈 나머지로 출력해주면 된다. L=int(input()) arr=str(input()) first=ord(..