데이터 사이언스로 한걸음

전체 글 118

들어가며코드를 작성할 때, 같은 동작을 여러 번 사용해야 하는 경우가 많습니다. 이 경우에는 매번 코드를 다시 작성하는 대신 함수(function)를 사용하면 훨씬 효율적으로 코드를 관리할 수 있습니다.함수 정의 및 호출 자바스크립트에서 함수는 다음과 같은 형태로 정의합니다. function 함수이름() { 실행할 코드;} 예를 들어, 콘솔에 “Hello JavaScript”를 출력하는 함수는 다음과 같이 작성할 수 있습니다. 하지만, 다음 코드는 함수를 정의한 상태일뿐 아직 실행되지는 않습니다.function sayHello() { console.log("Hello JavaScript");}선언한 함수를 실제로 실행하려면 함수 호출이 필요합니다. 다음과 같이 함수 이름 뒤에 () 를 붙이면 함수 내..

개발 2026.01.22

[n8n 실습] '삼성전자' 뉴스 수집 & 슬랙 전송 워크플로우

'삼성전자' 뉴스 수집 & 슬랙 전송 워크플로우 w/n8n들어가며n8n은 No-code/Low-code 자동화 플랫폼으로 다양한 서비스를 연결하여 워크플로우를 구성할 수 있습니다. 이 글에서는 n8n 입문 단계의 실습으로 '정해진 시간에 뉴스를 수집하고, 슬랙으로 전송하는 방법'을 소개합니다. 매일 아침 9시에 자동으로 '삼성전자' 뉴스를 수집하고, 슬랙으로 전송하는 n8n 워크플로우를 작업합니다. 실습 후, '삼성전자'뿐만 아니라 원하는 다른 키워드로 나만의 뉴스 자동 수집&슬랙 알림 워크플로우를 직접 구현할 수 있습니다.*이 실습은 로컬 PC에서 실행되는 n8n을 기준으로 하며, PC가 켜져 있을 때만 자동화가 동작됩니다. 컴퓨터 전원 여부와 상관없이 늘 실행되는 워크플로우는 다음 포스팅에 이어 설명..

개발 2026.01.15

[AWS] 루트 계정과 IAM 사용자의 차이 + 권장 설정 방법

루트 계정과 IAM 사용자의 차이 + 권장 설정 방법들어가며AWS에는 루트 계정과 IAM 사용자가 있습니다.루트 계정: AWS 계정의 절대 관리자입니다. 보안 상의 이유로 정말 필요한 경우에만 사용해야 합니다.IAM 사용자: 실제 작업할 때 사용하는 일반 업무용 계정입니다. 평소 작업은 IAM 사용자로 진행해야 합니다.이 글에서는 AWS의 루트 계정과 IAM 사용자의 개념과 역할을 이해하고, AWS가 권장하는 기본 설정 방법을 소개합니다.루트 계정이란?IAM 사용자란?루트 계정 사용을 권장하지 않는 이유AWS가 권장하는 계정 설정 방법참고) Account ID란?루트 계정이란?루트 계정은 AWS 계정을 처음 만들 때, 이메일과 카드 정보로 자동으로 생성됩니다. 계정당 오직 1개이며 모든 권한을 갖고 있으..

Etc 2026.01.07

네트워크 이해하기 #1 - 방향(인바운드, 아웃바운드)

네트워크 이해하기 #1 - 방향(인바운드, 아웃바운드)들어가며네트워크는 여러 역할이 동시에 작동하는 시스템입니다. 역할에 따라 4가지로 분류하면 다음과 같습니다.방향: “어디서 와서 어디로 가는가?”출입구: “외부와 내부는 어디서 만나는가?”통제: “이 트래픽을 허용할 것인가?”분배: “어디로, 어떻게 보낼 것인가?”이 글에서는 4가지 역할 중 ‘방향’에 대해 설명합니다. 네트워크의 ‘방향’은 트래픽이 어디에서 시작해서 어디로 가는지를 구분하는 개념으로, 이를 설명하는 용어가 ‘인바운드’와 ‘아웃바운드’입니다.인바운드와 아웃바운드인바운드, 아웃바운드 예시인바운드와 아웃바운드인바운드(Inbound)와 아웃바운드(Outbound)는 트래픽이 어디서 시작해서, 어디로 가는지에 따라 구분합니다. 각각의 개념은 ..

이론 2026.01.02

[이론] RAG 기초 개념 정리 - 등장 배경, 동작 과정

RAG 기초 개념 정리 - 등장 배경, 동작 과정들어가며 | RAG의 등장 배경이 글에서는 LLM의 한계를 보완한 RAG에 대해 소개합니다. RAG의 등장 배경, 개념부터 동작 과정까지 RAG를 이해하기 위한 기초를 설명합니다. RAG와 관련된 기술은 심화 편으로 다음 글에 이어서 설명 예정입니다.Chat GPT, Gemini 등 우리가 사용하는 LLM은 크게 2가지 한계가 존재합니다.첫째, “그럴듯하지만 틀린 답변”입니다. 이를 환각 Hallucination이라고 하는데, LLM은 사실을 조회하는 모델이 아니라, 다음에 올 단어를 확률적으로 예측하는 모델이기 때문입니다.둘째, 학습 시점 이후의 정보와 회사 내부 문서, 개인 자료에 접근할 수 없습니다. 따라서, 사내에만 공개된 데이터에 관한 질문을 하면..

이론 2025.12.28

[통계] 여론조사 속 통계(신뢰 수준, 표본오차) 개념 정리

여론조사 속 통계(신뢰 수준, 표본오차) 개념 정리들어가며2025년 11월 28~29일 전국 만 18세 이상 1002명 전화 면접조사, 표본오차: 95% 신뢰수준 ±3.1% P 여론조사 결과가 포함된 뉴스 기사에서 위와 같은 문장을 자주 확인할 수 있습니다. 이 문장은 조사 결과를 얼마나 믿을 수 있는지, 결과가 어느 정도의 오차를 가지고 있는지를 설명합니다.이 글에서는 '신뢰 수준'과 '표본오차'를 중심으로 여론조사 속 통계 개념을 정리하고, 관련 문장을 이해하는 것을 목표로 합니다.신뢰 수준이란?신뢰 수준과 신뢰구간의 차이모집단과 표본의 관계표본오차란?표본 크기와 표본 오차의 관계신뢰 수준이란?신뢰 수준(Confidence Level)이란, 통계적으로 추정한 결과가 얼마나 신뢰할 수 있는지를 나타내는..

이론 2025.12.22

[자바스크립트 입문 #5] 반복문 기초 - for, while

비슷한 작업을 여러 번 반복해야 할 때, 같은 코드를 복사-붙여 넣는 대신 반복문을 사용하면 매우 효율적입니다. 이 글에서는 자바스크립트 반복문의 기본 형태인 for문, while문을 소개합니다.for 반복문for문의 기본 문법은 다음과 같습니다.for (초기값; 조건식; 증감식) { 실행할 코드;}예를 들어, 1부터 5까지 출력하는 방법은 다음과 같습니다.for (let i = 1; i 파이썬동일한 내용을 파이썬에서는 다음과 같이 작성합니다.for i in range(1, 6): print(i)while 반복문while문은 조건이 참인 동안 계속 반복합니다. 반복 횟수가 정해지지 않았을 때 자주 사용합니다. while문의 기본 문법은 다음과 같습니다.while (조건식) { 실행할 코드;}예..

개발 2025.12.08

[아이폰 건강 데이터 분석] 테니스는 심혈관 건강에 얼마나 도움이 될까?

테니스는 심혈관 건강에 얼마나 도움이 될까?1. 서론분석 배경취미 생활로 테니스를 꾸준히 해왔고, 2022년부터 동호회 활동을 하며 규칙적인 주기를 갖게 되었다. 과연 일주일에 2~3회씩, 1회당 2시간 내외로 운동한 효과를 데이터로 증명할 수 있을까?호주 St Vincent's Institute의 '운동과 심박수'에 관한 연구에 따르면, 낮은 휴식기 심박수는 체력의 지표일 뿐만 아니라 더 나은 건강 결과를 예측하는 지표라고 설명했다. 연구 결과를 요약하면, 건강한 사람은 하루 동안 심장이 뛰는 총 횟수가 그렇지 않은 사람보다 현저히 적다는 것이다. Why exercise could actually save your heartbeats – not waste them - SVIProfessor André ..

데이터 분석 2025.11.23

[검색] 키워드 서치, 시맨틱 서치, 하이브리드 서치 개념 정리

키워드 서치, 시맨틱 서치, 하이브리드 서치 개념 정리들어가며 정보의 양이 방대해지면서 '검색'의 역할이 매우 중요해졌습니다. 과거에 수 천 개 문서를 검색하는 수준에서 벗어나 지금은 수백만 개의 문서 속에서 원하는 정보를 정확하게 찾아내야 합니다. 검색이 진화되면서 전통적인 키워드 검색부터 의미 기반 검색, 그리고 두 방식을 결합한 하이브리드 검색까지 발전했습니다. 이러한 발전을 통해 RAG, LLM 등 검색 시스템을 기반한 서비스들이 등장하며, 단순한 문서 조회를 넘어 ‘문맥을 이해하고 답변을 생성하는’ 새로운 형태의 정보 활용 방식이 가능해졌습니다.이 글에서는 키워드 서치, 시맨틱 서치, 하이브리드 서치에 대한 개념을 정리하고, 차이점을 비교하여 "검색"을 더 명확하게 알아보겠습니다.키워드 서치 K..

이론 2025.11.17

[통계] 중심극한정리 Central Limit Theorem, CLT에 대하여

중심극한정리 Central Limit Theorem, CLT에 대하여중심극한정리란?중심극한정리는 확률론과 통계학에서 중요한 이론 중 하나로, "표본의 평균이 정규분포에 가까워진다"는 사실을 설명합니다.중심극한정리란,"표본의 크기가 충분히 크면, 표본평균의 분포는 정규분포에 수렴한다"는 통계학의 핵심 이론입니다.예를 들어, '동전 던지기'에서 동전을 1번 던질 때 앞면이 나올 확률은 0.5(이항분포)입니다. 하지만, 동전을 100번 던져서 앞면이 나온 비율을 기록하고, 이 실험을 여러 번 반복하면 그 결과는 점점 정규분포 곡선에 가까워집니다. 즉, 개별 사건은 이항 분포를 따르지만, 그 평균의 분포는 정규분포에 수렴하게 되는 것을 '중심극한정리'라고 합니다.중심극한정리가 중요한 이유중심극한정리는 통계 추론..

이론 2025.11.09

1 2 3 4 ··· 12

안녕하세요 6년차 데이터사이언티스트/데이터분석가 GH입니다. 매일의 발견과 지금까지 겪었던 시행착오에 관해 기록합니다. 찾아와주셔서 감사합니다. ** 한걸음(명): 쉬지 아니하고 더 나아가 걷는 걸음이나 움직임. e-mail: wewegahyun@gmail.com

160x600

openweather, cx_oracle, OS, Folium, pdf, tfidvectorizer, 데이터프레임, AttributeError, 데이터분석, Python, 파이썬, matplotlib, pivot_table, json, pandas, 딥러닝, KONLPY, API, BeautifulSoup, 자바스크립트,

Today :
Yesterday :

전체 글 118

티스토리툴바