안드로이드 단말에서 LLM 돌리기

King

19 7월 2025 — 2 min read

안드로이드 폰에서 gguf 파일(로컬 LLM 모델)을 로딩하여 직접 실행하는 것은 가능합니다. 가장 실용적이며 많이 사용되는 방법은 다음과 같습니다:

실행 방법 요약

핵심 툴: llama.cpp
환경: 안드로이드에 리눅스 터미널 환경을 제공하는 Termux 앱

실제 동작 방법

Termux 설치
- 구글 플레이스토어나 공식 GitHub에서 Termux를 설치하세요.
필요 패키지 설치 및 llama.cpp 빌드
- Termux에서 다음 명령어로 기본 패키지 설치:
  
  bash
  apt update && apt upgrade -y
  apt install git cmake clang
- llama.cpp 코드 다운로드 및 빌드:
  bash
  git clone https://github.com/ggerganov/llama.cpp.git
  cd llama.cpp
  cmake -B build
  cd build
  make
gguf 모델 파일 다운로드
- Hugging Face 등에서 원하는 gguf 파일을 Termux 내로 다운로드합니다.
  bash
  curl -L "https://huggingface.co/경로/모델명.gguf" -o 모델명.gguf
모델 실행
- 예시 명령어:
  bash
  ./main -m ./모델명.gguf -p "안녕하세요!"
- 실제 명령어와 옵션, 추론 방법은 llama.cpp 공식 문서나 참고.

주의할 점 및 실제 체감

성능: 최신 하이엔드 폰(예: 스냅드래곤 8 Gen 3~Elite, RAM 12GB 이상)에서만 쓸만한 속도가 나올 수 있습니다.
예) 스냅드래곤 8 Elite 칩셋/NPU 지원 시 약 17 token/sec 속도 측정.
모델 용량: 너무 큰 gguf 모델(10GB 이상)은 메모리 부족 등으로 아예 실행이 안 될 수 있습니다. 보통 3B~7B, 양자화(Q4, Q5 등)된 버전을 선택하세요.
GPU/NPU 활용: 최신 Termux 및 폰에서 NPU, GPU 가속 지원되는 경우도 있으나, 한계와 폰별 차이가 큽니다.
실습 사례: 실제로 Galaxy S25 등에서 Termux + llama.cpp로 gguf 파일 실행 성공 사례가 다수 보고되어 있습니다.

결론

gguf 파일을 안드로이드 폰에서 직접 로딩·실행하는 것은 가능합니다.
대부분 Termux + llama.cpp 조합을 사용합니다.
하드웨어 및 모델 크기에 따라 속도와 실제 사용 편의성이 크게 다릅니다.

특별한 루팅이나 복잡한 설정 없이도 위와 같은 방법으로 시도할 수 있습니다.

AI, 국제수학올림피아드에서 금빛 업적 달성! 구글과 오픈AI의 놀라운 성과

AI의 수학적 혁명: IMO 금메달 도전기 AI, 국제수학올림피아드에서 금메달 획득! 2025년, 구글과 오픈AI의 인공지능이 세계 최고 난이도의 수학 대회에서 놀라운 성과를 거두었습니다. 이는 AI의 수학적 추론 능력이 인간 수준에 근접했음을 보여주는 획기적인 순간입니다. 주요 성과 * 🏅 오픈AI: 6문제 중 5문제 해결, 42점 만점 중 35점 획득 * 🏅 구글 Gemini: IMO 금메달 기준

WebAgent: Alibaba's Next-Gen AI Agent for Autonomous Web Information Exploration

WebAgent란 무엇인가? WebAgent는 알리바바의 통이랩(Tongyi Lab)에서 개발한 혁신적인 오픈소스 프로젝트로, AI 기반 웹 탐색의 한계를 넓히는 기술입니다. 핵심은 대형 언어 모델(LLM)을 기반으로 한 자율 에이전트로, 최소한의 인간 개입으로 웹을 탐색하고 정보를 수집하며 복잡한 추론 작업까지 수행할 수 있습니다. 이제 이 흥미로운 기술을 자세히 살펴보고 어떻게 작동하는지

YOLO 모델 학습 결과 비교 기준과 효율적 평가 방법에 관한 고찰

YOLO 모델 학습을 진행하며 데이터셋 증강, 배치 구성 등의 변수 조작 후 학습 결과 비교를 위한 연구는 매우 중요한 과정입니다. 특히, 논문 작성 시 수정이 가해지지 않은 기본 상태와 고안한 방법을 적용한 상태의 학습 결과를 비교할 때 어떤 모델 파일을 기준으로 할지 고민하는 경우가 많습니다. YOLO 학습을 400 epoch로 설정할

역사의 장막을 벗기다: MLK 기밀문서, 정치 스캔들, 그리고 헌터 바이든의 충격 발언

미국 정치의 숨겨진 진실들, 이제 공개된다! 🔍 마틴 루터 킹 주니어 암살 문서 23만쪽 전격 공개 2025년 7월 21일, 국가정보국(DNI)이 MLK 암살 사건의 숨겨진 진실을 담은 6,000여 건의 문서를 최초로 공개했습니다. 트럼프 대통령의 행정명령에 따라 국민의 알 권리를 위해 추진된 이번 공개는 역사적 투명성의 중요한 이정표로 평가됩니다. 📂 오바마-코미