작은 행렬 연산 벤치마크 테스트(파이토치, 러스트)

최근 Rust언어로 작성된 Candle이라는 라이브러리에 관심을 가지며 파이토치와 Candle로 작성한 코드의 벤치를 간단하게 테스트 해보던 중에, 다음과 같은 요청을 받았다. 본인의 도메인에서는 작은 행렬을 연산하는 것이 일반적인데, 파이토치가 여기에 bad job이라고 한다. 실제로 확인하기 위해서 코드를 작성 후 테스트를 하였다 테스트 환경 CPU : AMD Eyzen Threadripper PRO 3955WX 16-cores GPU : A6000 python version: 3.11.5 pytorch version: 2.1.1 numpy version: 1.24 rust version: 1.74.0 candle version: 0.3.1 테스트 파이토치, CPU 3 x 3 행렬을 각각 1천만개씩 ..

→2023.12.09

23년 이전 글/TPU

Huggingface Trainer로 TPU Multicore 활용 학습 예제코드

from datasets import load_dataset from transformers import AutoTokenizer, DataCollatorWithPadding from transformers import TrainingArguments, AutoModelForSequenceClassification from transformers import Trainer def main(index): # 예제로 활용할 데이터셋 raw_datasets = load_dataset('glue','mrpc') # 예제 활용 모델 model_name = 'klue/roberta-large' tokenizer = AutoTokenizer.from_pretrained(model_name) #raw_dataset은 ..

→2022.12.21

작은 행렬 연산 벤치마크 테스트(파이토치, 러스트)

Huggingface Trainer로 TPU Multicore 활용 학습 예제코드

티스토리툴바