'정보통신 Topic' 카테고리의 글 목록

Open source LLM [출처 : https://www.linkedin.com/pulse/deep-dive-opensource-llms-vs-proprietor-dr-rabi-prasad-kutuc]

[배경]
- 딥러닝 모델의 크기가 증가함에 따라, 모듈 튜닝에 있어 모든 파라미터를 미세조정하는 Full-Fine-Tuning 방식은 자원 측면에서 점점 불가능해짐

- LLM 모델 파라미터를 효율적으로 Fine-Tuning 하는 방법이 필요

[본문]
1. PEFT(Parameter Efficient Fine-Tuning) 개념
- LLM을 특정 작업이나 도메인에 맞게, 학습할 파라미터를 제한적으로 설정하여 효율적으로 조정하는 기법

2. 개념도

3. 요소기술

구분	개념도	설명
LoRA (Low-Rank Adaptation)		- Low-Rank Adaptation 추가하여 필요한 파라미터만을 조정 - 큰 행렬을 저차원 행렬로 분해해 파라미터 수를 줄임
Adapter		- 기존의 신경망 모델에 추가적인 작은 네트워크 모듈을 삽입하는 방식 - 원래 모델의 파라미터는 동결시키고, 새로 추가된 어댑터 파라미터만을 학습하여 성능을 개선
Prompt Tuning		- 입력 데이터에 대해 학습 가능한 프롬프트를 추가하여 모델의 출력을 조정 - 문장 앞에 특수한 토큰을 추가하여 모델의 반응을 조절

<그림출처>

LoRA LORA LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 논문

Adapter https://magazine.sebastianraschka.com/p/finetuning-llms-with-adapters

Prompt Tuning https://vinija.ai/nlp/parameter-efficient-fine-tuning/

4. 특징

구분	설명
효율성	전체 모델이 아닌 일부 파라미터만 조정
기존모델활용	사전 학습된 모델을 기반으로 추가 학습
자원 절약	메모리와 계산 자원을 절약, 학습 효율성 증가

5. 비교표

구분	PEFT(Parameter Efficient Fine-Tunning)	프롬프트 엔지니어링
개념	모델의 파라미터를 조절하여 특정 데이터셋에 대해 더 좋은 성능을 얻는 기법	입력되는 질문을 최적화하여 원하는 출력을 얻는 기법
성능향상	높음	제한
비용	상대적으로 높음	적음
모델변경	모델변경됨	변경 없음
활용	특정 도메인에 특화된 성능	다양한 상황 질문 대응

6. 동향
- PEFT와 RAG를 혼합하여 대규모 모델 GPT-4, BERT에 적용되고 있음
[끝]

[참고]

1. LLM 적용 방법인 PEFT와 RAG 비교 세미나 강의

2. Open AI 2024 세미나에서의 RAG와 Fine-Tuning의 Usecase

출처 : Maximizing LLM Performance Open AI 2024

- RAG : 모델의 지식적인 측면을 수정하고자 하는 경우

- Fine-Tuning : 모델이 어떻게 답변하고 추론하는지를 수정하고자 하는 경우

저작자표시 비영리

'정보통신 Topic > . 정보통신' 카테고리의 다른 글

풀스택 옵저버빌리티(FSO) (0)	2023.07.08
그린데이터센터 인증제도 (0)	2023.01.24
비접촉식(Tagless) 대중교통 요금 결제 시스템 (0)	2022.08.04
POTN(Packet Optical Transport Network) (0)	2022.03.18
인공지능 학습용 데이터(AI Dataset) (0)	2022.03.15

각 계층별 다양한 서비스 [출처: https://academy.broadcom.com/blog]

[배경]
- 클라우드 기반, 마이크로서비스, 컨터이너, 서버리스 기술을 도입하는 곳이 많아져, 기술의 복잡도가 증가함

- 급증하는 IT 복잡성을 관리하는 동시에, 시스템을 최고성능을 유지하는 기술이 필요

[본문]
1. 풀스택 옵저버빌리티의 개념
- IT 환경에 분산된 각 기술 스택 구성 요소의 실시간 상태를 관찰하여 오류 발생원인을 진단하는 기술
2. 개념도

풀스택 옵저버빌리티의 모니터링 관계도[출처 : Cisco https://www.youtube.com/watch?v=-ws4dk753x8]

3. 요소기술

구분	설명
메트릭(Metric)	인프라, 미들웨어, 서비스 상의 CPU나 메모리 사용량, 네트워크 트래픽과 같은 정량적 성능 정보
트레이스(Trace)	애플리케이션 전반의 서비스 호출 순서와 응답 시간 등 동작 정보
로그(Log)	사용자 작업 및 오류를 포함한 시스템 활동 기록
이벤트(Event)	특정 사건 또는 활동에 대한 개별 발생 또는 알림
머신 러닝	AI 분석 기반 이상 탐지 및 예측 기능

4. 특징

구분	설명
가시화	전체 IT 환경에 대한 가시성 제공
신속한 대처	전체 스택에 대한 광범위한 모니터링을 통한 신속한 인지 및 대처
실행 가능한 정보 제공	최적화을 위한 실행 가능한 정보 제공

5. 비교표

구분	FSO(Full-Stack Observability)	APM(Application Performance Monitoring)
모니터링 범위	인프라, 애플리케이션, 서비스 및 사용자 경험을 포함한 전체 소프트웨어 스택을 모니터링	개별 애플리케이션
데이터 소스	메트릭, 로그, 추적 및 이벤트	CPU 사용량, 메모리 사용량 및 트랜잭션 응답 시간
목적	전체 소프트웨어 스택에 대해 더 광범위하고 전체론적인 최적화	개별 응용 프로그램의 성능을 모니터링하고 최적화
가시성	제공	제공
시스템간 종속성	제공	미제공

6. 동향
- Cisco에서는 "Thousand Eyes"를 통해서 예측 분석을 확대하고 있음
[끝]

[참고]

저작자표시 비영리

'정보통신 Topic > . 정보통신' 카테고리의 다른 글

LLM PEFT(Parameter Efficient Fine-Tuning) (0)	2024.08.22
그린데이터센터 인증제도 (0)	2023.01.24
비접촉식(Tagless) 대중교통 요금 결제 시스템 (0)	2022.08.04
POTN(Packet Optical Transport Network) (0)	2022.03.18
인공지능 학습용 데이터(AI Dataset) (0)	2022.03.15

[배경]
- SK C&C 판교 데이터센터 화재에 따른 데이터센터 설계 시공관리 중요성 증대
- 탄소제로 실현을 위해 데이터센터의 운영효율성 향상 및 안전성 개선을 위한 지침 및 표준 필요
[본문]
1. 그린 데이터센터 인증제 개념

- 데이터센터 그린화를 위한 근거, 방법 및 유인책을 제공하고 에너지효율적 데이터센터를 공인하는 제도

2. 그린 데이터센터 개념도

그린 데이터센터 [출처: https://newsroom.koscom.co.kr/29211]

3. 그린데이터센터 인증 평가항목

구분	평가항목
인프라효율성 지표(PUE)	- ISO/IEC 30134-2(PUE)를 준용 - PUE = Total Facility Power(총전력) / IT Equipment Power(IT장비전력)
그린활동 지표	- 정책 및 운영분야, 시설분야로 구분된 정성적 항목

4. 그린데이터센터의 IT 부문 추진 영역

구분	설명
통합 및 가상화	- IT 시스템의 효율 향상 및 자원 활용도 증대
자원공유	- 자원의 불필요한 중복을 줄여 관리효율 증대
개별 IT 자원의 고효율화	- 개별 시스템의 에너지 효율 증대 및 그린 기술 적용
재활용	- 자원의 적절한 재활용 및 폐기를 통한 Co2 발생 감소

5. 비교표

구분	인증전	인증후
에너지 효율	보통	효율 증대
PUE	2이상	1이상
재생에너지	선택사용	의무사용
탄소배출	보통	절감
지속가능성	보통	높음

6. 동향 및 고려사항

- 정부에서는 K-택소노미에 근거한 강화된 환경규제 시행으로 친환경 데이터센터 전환 가속화
- TIA-942에 근거한 질적 수준 평가와 함께 전문가에 의한 설계 및 시공 관리와 동시에 수행 필요.

[끝]

[참고]

1. TIA-942에서 분류하는 데이터센터 품질 4단계

구분	Tier Ⅰ	Tier Ⅱ	Tier Ⅲ	Tier Ⅳ
가용성(%)	99.671	99.749	99.982	99.995
연간 장애발생시간	28.8	22.0	1.6	0.8
Component	N	N+1	N+1	2N 또는 2N+1
Component
Delivery Paths	One only	One only	One Active One Passive	Two Active
Single Points Failure	Yes	Yes	Yes	No
Concurrently Maintainable	No	Component only	Yes	Yes

[출처 : Uptime Institue의 Tier Level]
[참조기사 및 관련자료]
http://www.kharn.kr/news/article.html?no=16291

데이터센터 효율 표준화, ‘그린데이터센터인증’ 선두

4차 산업혁명이 진행됨에 따라 데이터를 기반으로 한 많은 산업들이 발전하고 있다. 또한 코로나19는 실현에 4~5년은 걸릴 것이라고 예측됐던 비대면산업의 성장을 가속화하고 있다. 데이터센터(

www.kharn.kr

http://www.koit.co.kr/news/articleView.html?idxno=105006

“데이터센터 설계·시공·관리에 ICT 전문가 참여해야” - 정보통신신문

[정보통신신문=서유덕기자] SK C&C 판교 데이터센터(IDC: Internet Data Center)에서 일어난 화재 사고로 카카오 서비스 중단 사태가 발생한 지 보름여가 지났다. 정부와 업계는 정보통신기술(ICT) 산업은

www.koit.co.kr

TTAK.KO-09

2.56MB

저작자표시 비영리

'정보통신 Topic > . 정보통신' 카테고리의 다른 글

LLM PEFT(Parameter Efficient Fine-Tuning) (0)	2024.08.22
풀스택 옵저버빌리티(FSO) (0)	2023.07.08
비접촉식(Tagless) 대중교통 요금 결제 시스템 (0)	2022.08.04
POTN(Packet Optical Transport Network) (0)	2022.03.18
인공지능 학습용 데이터(AI Dataset) (0)	2022.03.15

[배경]

- COVID-19 대유행에 대응한 대중교통체계 일환으로 비접촉식 대중교통 요금 결제 시스템이 도입 중임.

- 경기도의 Tagless 버스가 시범사업 중이며 서울시 지하철의 비접촉식 게이트가 연구중임

[본문]

1. 비접촉식(Tagless) 대중교통 요금 결제 시스템의 개념

- 별도의 태그 없이 결제가 가능한 대중교통 결제 시스템

2. 개념도

비콘과 블루투스의 서비스 동적 원리 [출처 BLE기반 근거리 데이터 통신기 술로 주목 데이터넷(2014,12,19)]

3. 요소기술

구분	설명
비콘	근거리 내 무선 신호 감지 장치 (방사형 비콘과 지향성 비콘 동시사용)
블루투스 4.0	BT4.0 LE(Low Energy)의 저전력 무선 연결 기술
ID 식별	스마트폰을 통한 개인 ID 식별 기술

4. 특징

구분	설명
승하차 시간 단축	버스 / 지하철 승하차 시간 단축
외부 신호 감지 문제 해결	방사형 비콘과 지향성 비콘을 동시에 사용
사고예방	두 손이 자유로워 손잡이를 잡을 수 있어 사고 예방

5. 비교표

구분	v2.0 EDR(Enhanced Rate)	v4.0 LE(Low Energy)
사용 주파수	2.4GHz ISM밴드	2.4GHz ISM밴드
전송속도	3Mbps	1Mbps
변조방식	8DPSK	GFSK
연결토폴로지	Point to Point(1:1)	Point to Point (1:1) Broadcast (1:N) Mesh (N:N)
최대 동시 연결 수	7개	약 6만개

6. 동향

- 경기도내 버스 시범사업(Tagless)이 2020년부터 수행중이며, 서울시에서는 2022년부터 지하철 시범사업후 전면 확대 예정

- 새로운 Tagless 시스템 도입시 기존 시스템과 호환성 고려 필요

우이신설선 비접촉식 게이트[출처 티머니] 및 서울교통공사 실증장면[출처 서울교통공사]

[끝]

출처 : 경기연구원 "비접촉식 버스요금 결제 시스템 도입 및 확대방안"

F2021-38.pdf

19.92MB

저작자표시 비영리

'정보통신 Topic > . 정보통신' 카테고리의 다른 글

풀스택 옵저버빌리티(FSO) (0)	2023.07.08
그린데이터센터 인증제도 (0)	2023.01.24
POTN(Packet Optical Transport Network) (0)	2022.03.18
인공지능 학습용 데이터(AI Dataset) (0)	2022.03.15
Proxy Server (0)	2022.03.08

[배경]
- 광전송망, 회선망, 패킷망이 계층별로 별도 구축되어 망 관리가 복잡하며, 소비전력도 증가하여 개선 필요
- 차세대 모바일 네트워크등의 대용량 트래픽 발생에 따른 동적인 유선망 증대 필요
[본문]
1. 개념
- 광 전송과 회선, 패킷 전달망 계층을 통합한 패킷 광 전송 네트워크
2. 개념도

OTN Switching [출처:T-SDN 기반 중용량POTN시스템 상용화개발최종보고서]

3. 구성요소

구분	설명
PTN(CE) 기능	MPLS-TP기반 PTN 서비스 1. L2 VPN 2. IP Routing 3. OAM
OTN 기능	1. 보호절체 2. 다양한 서비스 수용 3. 고속전송 4. 오류정정 5. 망효율성 극대화
ROADM(DWDM) 기능	1. 원격에서 광파장 Add. Drop 2. 파장, 채널 Re-routing 3. 망 유연성 증대
T-SDN 기능	1. 계층 통합형 End-to-End 경로 처리 2. 표준 제어 명령

4. 특징

구분	설명
네트워크 구조 단순화	- 광, 회선, 패킷 전달망을 통합해 구조 단순화로 운영비용 절감
용량 부족 해결	- 트래픽 폭증이나 전송 용량 부족 현상 해결
통합적 제어	- End-to-End Provisioning 구현

5. OTN과 P-OTN의 비교

구분	OTN	POTN
계층	L0 + L1	L0 + L1 + L2
Switching	SDH, OTN	SDH, OTN, Packet
MPLS-TP 연계	미지원	지원
장점	파장 유연성	네트워크 단순화
SDN연계	일부 연계	T-SDN 연게

* 계층별 스위칭 (L0 : 파장 스위칭 / L1 : Circuit 스위칭 / L2 : Packet 스위칭)

P-OTN 전달평명 [출처 : https://ensxoddl.tistory.com/391]

6. 동향
- 원격진료 및 화상회의 등에 필요한 고신뢰성 저지연 통신(Ultra-reliable and Low Latency)의 기반 마련
- 우리넷은 메트로급 POTN (M-POTN) 장비를 상용화 함. (21.12)

T-SDN&nbsp;[출처:T-SDN 기반 중용량POTN시스템 상용화개발최종보고서]

[끝]

저작자표시 비영리

'정보통신 Topic > . 정보통신' 카테고리의 다른 글

그린데이터센터 인증제도 (0)	2023.01.24
비접촉식(Tagless) 대중교통 요금 결제 시스템 (0)	2022.08.04
인공지능 학습용 데이터(AI Dataset) (0)	2022.03.15
Proxy Server (0)	2022.03.08
802.11 be EHT(Wi-Fi 7) (0)	2022.03.06

Courier Fairy's Investigate