캐시 메모리의 사상 방식은 주기억장치와 CPU 사이에 위치한 캐시 메모리에 데이터를 저장하는 방법을 결정한다. 주로 세 가지 사상 방식에 대해 알아보고자 한다. 1. 직접 사상(Direct Mapping) 주소를 캐시 블록에 직접 매핑하는 방식이다. 메인 메모리 주소를 캐시 주소로 직접 변환하는 것으로 캐시 라인의 인덱스에 주소를 할당한다. 한 주소가 특정 캐시 라인에만 매핑되므로 충돌이 발생할 수 있다. 이 때문에 캐시 매모리에 충돌을 최소화하기 위한 대체 전략(LRU 등)이 필요할 수도 있다. 각 메모리 블록이 캐시 슬롯 하나에만 할당되는 방식으로 간단한 하드웨어 구현이 가능하지만 충돌 발생 시 슬롯을 공유하는 다른 블록이 적재될 때 Swap-Out될 가능성이 있다. 직접 사상 캐시의 예 기억장치 블..
모델을 개발하기 위해 2022년을 기준으로 데이터를 수집한다. 관련 논문 및 자료를 참고하여 데이터셋을 만들 것이다. 갈 길이 멀기에 모델 학습을 먼저 한 뒤 결과에 대한 문서화는 추후에 다시 정리할 예정이다. 1. 서울 특별시 공공자전거 이용정보(시간대별) 서울특별시 공공자전거 이용정보(시간대별)로 나와있는 데이터를 2022년 기준으로 달 별로 데이터를 다운받아서 하나로 합쳐야 한다. /data 라는 폴더를 하나 만들고 concat을 사용하여 합친다. (이러고 나니까 데이터가 커져서 오래걸렸다.) 사용하고자하는 칼럼은 대여일자, 대여시간, 이용건수 이기에 인덱스를 재정렬한다. 대여일자가 2022-09-14의 형식으로 이루어져 있기에 년도, 월, 일, 요일(num), 공휴일로 시간 변수를 생성한다. 2...
ALU(Arithmetic and Logical Unit) 산술 논리 연산 장치는 가산기를 중심으로 연산 결과 등을 기억하는 레지스터, 보수 값을 생성하는 보수기, 오버플로를 검출하는 오버플로 검출기 등으로 구성되어 있다. 사칙연산인 산술 연산과 두 수의 크기를 비교하고 판단하는 논리연산의 기능을 한다. 자료의 수가 하나일 경우에는 단항 연산을 두 개의 자료에 대해서는 2진(binary) 연산을 수행한다. 주기억장치에 있는 데이터를 레지스터에 입력한다. 비트들을 좌우로 이동시키는 시프트 레지스터(shift register)와 연산 결과의 상태를 나타내는 플래그를 저장하는 상태 레지스터(status register)가 있다. CPU 연산을 위해서는 Data 정보가 있어야 한다. 레지스터의 개수가 많을 수록..
회귀(Regression) 회귀(Regression)는 입력과 출력 값 사이의 관계를 학습하여 주어진 입력에 대한 출력 값을 예측하는 데 사용되는 학습 방법이다. 회귀 모델은 주어진 데이터를 가장 잘 설명하고 근사하는 함수를 찾는 것이 목표이다. 주로 연속적인 값을 예측하고자 할 때 활용된다. 학습 데이터셋 {𝐱₁, 𝑦₁, 𝐱₂, 𝑦₂, … , 𝐱ₘ, 𝑦ₘ}에서 입력 데이터 𝐱와 이에 상응하는 출력 값 𝑦 사이의 관계를 설명하는 함수 ℎ(𝐱)를 찾는다. 예를 들어 자동차의 특성(차종, 제작년도, 주행거리 등)을 이용하여 중고 자동차의 판매 가격을 예측하는 등의 문제에 활용된다. 용어 및 표기법 i번째 샘플 및 레이블 x(i) : i번째 샘플의 특성 값(열) y(i): i번째 샘플에 대한 출력 값(=목표 ..
학습 데이터의 구성 학습에 사용되는 개별 데이터를 샘플이라 한다. = 학습 인스턴스, 학습 예제 학습 데이터는 입력과 출력의 쌍으로 이루어져있고, 새로운 입력에 대한 출력으로 대응관계를 만족시키는 함수 h(x)를 찾는다. ex) 지역별 주택 가격 예측 문제 : 샘플 1 입력 : 각 지역 출력 : 그 지역의 주택 가격 (서울 강남구, 1,234,000 ) 강남과 강북은 비슷하니 부적적할 데이터이다. 입력과 출력의 관계는 명확해야 하며 인구수나 소득 등의 어떤 요소가 영향을 미치는지에 대한 표현이 명확해야 한다. 샘플은 여러 특성(feature, 특징, 자질)들로 구성한다. 즉, 특성들로 목표(target)값을 예측할 수 있도록 학습 데이터를 구성해야 한다. 목표값 = 레이블(label)=클래스(class)..
자료의 구성단위 파일은 개념적으로 자료의 집합이다. 파일 시스템은 파일 내용과 파일의 상태정보로 이루어져 있다. 파일의 상태 정보에는 파일을 수정, 저장, 삭제한 내역들이 담겨 있다. 저장 내용에 따라 프로그램 파일(원시 프로그램 파일, 목적 프로그램 파일, 실행 파일)과 데이터 파일로 나뉜다. 저장 정보의 형태에 따라서는 텍스트 파일과 이진 파일로 나뉜다. 필드(field)는 특정한 한 종류의 자료를 포함하는 기억 영역의 최소 단위이다. 예를 들어 재고 파일의 품명 번호나, 색코드 등이 필드이다. 레코드(record)는 실제로 읽고 쓰는 단위로서 사용되는 자료 단위이다. 고정 길이 레코드는 크기가 너무 작으면 남는 문자열이 잘리고 크기가 너무 크면 저장 공간이 낭비된다. 가변 길이 레코드는 레코드의 정..