본문 바로가기

분류 전체보기

(78)
Phi-4-Mini Multimodal SLM Mixture of LoRAs 설계 https://huggingface.co/microsoft/Phi-4-multimodal-instruct/blob/main/phi_4_mm.tech_report.02252025.pdf Phi-4-Mini 및 Phi-4-Multimodal은 마이크로소프트에서 개발한 소형 고성능 언어 및 멀티모달 모델이다. Phi-4-Mini는 38억 개의 파라미터를 가진 언어 모델로, 고품질 웹 및 합성 데이터를 사용하여 학습되었으며, 유사한 크기의 오픈 소스 모델보다 뛰어난 성능을 보이며 복잡한 추론이 필요한 수학 및 코딩 작업에서 두 배 크기의 모델과 비슷한 성능을 보인다. 이는 고품질 수학 및 코딩 데이터 세트를 강조한 합성 데이터 레시피 덕분이다. Phi-3.5-Mini에 비해 Phi-4-Mini는 다국어 지원을 ..
Stronger reasoning on the horizon - GPT 4.5 https://openai.com/index/introducing-gpt-4-5/  TL;DR OpenAI의 GPT-4.5는 사전 훈련을 통해 지능과 지식을 향상시켜 추론 및 도구 활용 에이전트의 강력한 기반이 될 것으로 기대된다. GPT-4.5는 기존의 지도 학습 미세 조정(SFT) 및 인간 피드백 강화 학습(RLHF) 방법과 함께 새로운 감독 기술로 훈련되어 모델의 안전성을 강화한다. GPT-4.5는 Chat Completions API, Assistants API 및 Batch API에서 개발자에게 제공되며, 함수 호출, 구조화된 출력, 스트리밍, 시스템 메시지 등의 주요 기능을 지원한다. 초기 테스트 결과, GPT-4.5는 높은 감성 지능과 창의성이 필요한 애플리케이션, 예를 들어 작문 지원, 의..
[Transformers] Trainer 사용법 1. Hugging Face Trainer 소개개요: Trainer는 Hugging Face의 transformers 라이브러리에서 제공하는 고수준 API로, 모델의 학습, 평가, 예측 프로세스를 간소화합니다. 기본적인 훈련 루프와 데이터 처리, 최적화 등을 자동으로 처리하여 사용자가 더 중요한 작업에 집중할 수 있도록 돕습니다. PyTorch와 TensorFlow를 모두 지원합니다.2. Trainer의 주요 구성 요소와 메커니즘학습 루프: Trainer는 모델 학습, 평가, 예측을 처리하는 자동화된 루프를 제공합니다. 기본적인 흐름은 다음과 같습니다:데이터 로딩: Trainer는 datasets 라이브러리 또는 사용자가 정의한 커스텀 데이터셋을 사용해 데이터를 로드하며, DataLoader를 사용하여 ..
Stable Diffusion Web UI linux 서버에서 설치 (sudo 권한 필요 x) 우선순위로 설치 필요한 라이브러리 설치우선 나의 경우는, 우선적으로 사용가능한 torch 버전이 낮아 torch를 먼저 설치해야 했다.conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch  가상환경 생성conda create -n sd.web python=3.10.6 git clonegit clone git clone https://github.com/AUTOMATIC1111/stable-diffusion-webuino-deps로 requirement 설치pip install requirements.txt --no-deps launch.py 실행CUDA_VISIBLE_DEVICES=0 ..
[Perplexity 사용 Tip #1] 프롬프트 몇 번으로 torch dependency 해결하기 딥러닝 오픈소스를 가져올 때 마주하는 가장 큰 문제는 단연컨대 가상환경 세팅이라고 생각해요. 별일 아닌 것 같은데, 참조하는 레포지토리를 따라갔다가 내 gpu 환경에서는 맞지 않는 것 때문에 삽질을 하셨던 경험이 다들 한번쯤 있으셨을 텐데요. 오늘은 Perplexity를 활용해, 프롬프트 몇 번으로 위와 같은 torch dependency 문제를 해결하는 방법에 대해 이야기를 해보려고 해요. Use Case) 주어진 링크 와 같이 복잡한 가상환경을 저장해둔 파일이 있다고 가정해봅시다. 기존 가상환경의 핵심은cuda=11.7torch=2.0.1 이고,   pytorch=2.0.1=python3.9_cuda11.7_cudnn8.5.0_0 과 같이 설치된 환경이 함께 나열된 것을 확인할 수 있습니다. 하지만 ..
[KT AI 석사과정] 2024학년도 가을학기 합격 수기 (4) 포항공대 AI대학원 입시 안녕하세요, 이번 포스팅에서는 대학원 입시에 대해 작성하겠습니다. 우선 저는 원하는 연구 분야를 찾아 포항공대에 지원했습니다. 포항공대는 아래와 같은 프로세스로 대학원 입학이 결정됩니다. (1) 서류 (2) 입학 시험 (3) 교수님 컨택 위 3개의 과정이 모두 마무리가 되어야 최종 합격이 마무리가 됩니다.  우선 서류는 자기소개서와 연구계획서로 나뉩니다. 자기소개서 (자유로운 분량으로, 성공적인 삶이 무엇이라고 생각하는지에 대해 자아실현과 공동체기여라는 두 측면에서 기술하고, 지원자가 성공적인 삶을 살아가기 위해 포항공과대학교 대학원에서의 학위과정이 어떤 의미를 가지는지에 대해 기술하시오. 특히 지원자가 지금까지 어떠한 노력을 해 왔으며 앞으로 어떠한 노력을 할 것인지를 중심으로 작성하시오.) 저는 제가..
[KT AI 석사과정] 2024학년도 가을학기 합격 수기 (3) 직무 면접 및 임원 면접 안녕하세요. 이번 포스팅에서는 직무 면접 및 임원 면접 포스팅을 작성해보겠습니다. 면접 때 분위기나, 복장, 그리고 어떤 질문들을 대비하면 좋을지를 공유해드리겠습니다.  직무 면접 우선 직무 면접은 제가 석사 과정을 마치게 되면 근무하게 될 곳인 판교 사옥에서 진행됐습니다. 누가봐도 새 건물이었고, 대기장부터 면접관 분들까지 모두 친절하고 나긋나긋하게 맞아주셨습니다. 면접 분위기도 굉장히 편안했구요. 면접 복장은 비즈니스 캐주얼로, 남자의 경우는 넥타이를 하고 오지 않으면 됩니다. 저는 그래서 블레이저와 슬렉스를 입고 면접에 응했습니다. 대비해야 할 면접 질문은 아래와 같아요. 2분 자기소개(지원 동기, 관련 역량, 희망 지도교수를 연관 지은)자기소개서 기반한 꼬리 질문(했던 일, 맡은 역할, 힘들었던 ..
[KT AI 석사과정] 2024학년도 가을학기 합격 수기 (2) 인적성 및 코딩테스트 이어서 글을 작성합니다. 인적성 및 코딩테스트가 저는 가장 어려웠습니다. 코딩테스트에 대한 지식이 아~~~예 없었기 때문이기도 하고, 인적성 역시 시도했던 적이 없었거든요. 인적성 / 코딩테스트로 챕터를 나누어 설명을 드리도록 하겠습니다.  1. 인적성 우선 KT 인적성은 아래의 책으로 대비를 했습니다. 준비 기간은 10일 정도였구요.  2024 SD에듀 All-New KT그룹 온라인 종합인적성검사 최신기출유형+모의고사 5회+무료KT특강 | SDC - 교2024 SD에듀 All-New KT그룹 온라인 종합인적성검사 최신기출유형+모의고사 5회+무료KT특강 | 도서 특징 1. 2023년 하반기 기출복원문제로 최신기출문제 확인 2. 최신출제경향 분석을 통한 출제유형분product.kyobobook.co.kr ..

반응형