소프트웨어 개구리

전체 글

우분투 엔비디아 드라이버 업데이트 업그레이드 Ubuntu Nvidia Driver Update Upgrade

동양상인 2022. 11. 6. 13:35

2022. 11. 6. 13:35

Ubuntu 18.04에서 Nvidia 그래픽스 카드의 디바이스 드라이버를 업데이트하는 과정입니다.

1단계. 사용 가능한 드라이버를 체크합니다.

아래 명령어를 실행합니다.

ubuntu-drivers devices

출력 결과는 아래와 같습니다.

'recommended'로 표시된 드라이버를 설치하는 것이 좋습니다.

2단계. 드라이버를 설치합니다.

설치 명령어는 아래와 같습니다.

sudo ubuntu-drivers autoinstall

특정 드라이버를 선택해서 설치할 수도 있습니다.

sudo apt install nvidia-driver-470

3단계. 시스템을 재시작합니다.

sudo reboot

LIST

저작자표시 비영리 변경금지 (새창열림)

'리눅스(Linux)' 카테고리의 다른 글

Conda 명령어 정리 (1)	2024.12.21
우분투 버전 정보 출력 명령어; Ubuntu Version Display Command (0)	2022.11.06
SW기초실습1 3차시: rm, cat, multiple file compile (0)	2015.03.26
SW기초실습1 2차시: gcc를 이용한 컴파일 (0)	2015.03.26
SW기초실습1 1차시: pwd, ls, mkdir, rmdir, cd (0)	2015.03.26

파이토치(Pytorch) Distributed Data Parallel (DDP)사용하기

동양상인 2022. 10. 30. 16:29

2022. 10. 30. 16:29

DDP를 사용하려면 다음과 같은 설정단계를 거쳐야 합니다.

첫 번째 단계는 초기화 단계입니다.

전체 GPU의 개수가 몇 개인지를 설정합니다.

그리고 현재 프로세스가 사용하는 GPU 번호를 정합니다.

이것을 위해서 아래 코드를 이용하면 됩니다.

# 1번
    dist_url = 'env://'
    rank = int(os.environ['RANK'])
    world_size = int(os.environ['WORLD_SIZE'])
    local_rank = int(os.environ['LOCAL_RANK'])

# 2번
    torch.distributed.init_process_group(backend='nccl', init_method=dist_url, world_size=world_size, rank=rank)
    torch.cuda.set_device(local_rank)
    torch.distributed.barrier()

# 3번
    if torch.distributed.get_rank() == 0:
        print(f'RANK {rank}    WORLD_SIZE {world_size}     LOCAL_RANK {local_rank}')

1번에서 world_size는 사용되는 전체 GPU의 개수입니다.

local_rank는 이 프로세스가 사용하는 GPU의 번호입니다.

DDP에서는 1개의 프로세스가 1개의 GPU를 사용하는 구조입니다.

예를 들어, 4개의 GPU가 있다면, 모두 4개의 프로세스가 각자 자신의 GPU를 사용합니다.

이 때, 프로세스 입장에서 자신이 사용하는 GPU의 번호를 local_rank라고 합니다.

local_rank를 환경변수 LOCAL_RANK에서 받아옵니다.

프로그램이 실행되면서 이 변수가 자동으로 설정되기 때문입니다.

2번에서는 그룹을 초기화 하고, 프로세스가 사용할 GPU 번호를 실제로 설정하는 과정입니다.

torch.distributed.barrier()는 여기까지 수행된 후, 더 진행하기 전에 다른 프로세스들이 여기까지 수행하기를 기다릴 수 있도록 합니다.

이것을 이용하면 1개 프로세스가 먼저 독주하여 동기화가 흐트러지는 것을 막을 수 있습니다.

3번에서는 메인 프로세스만 출력하도록 하는 방법을 보여줍니다.

여러 프로세스들을 수행되기 때문에 1개의 print 문 일지라도 각 프로세스가 실행하면 그 개수만큼 출력됩니다.

이렇게 되면 출력이 혼잡스러워질 것입니다.

이를 해결하기 위해 메인 프로세스만 출력하도록 하면 됩니다.

자신이 메인 프로세스일 때만 print문을 수행하는 것입니다.

메인 프로세스의 rank = 0로 확인할 수 있습니다.

두 번째 단계는 데이터 샘플러 설정단계입니다.

여러 프로세스들이 1개의 데이터세트를 공유하기 때문에, 샘플러가 필요합니다.

데이터세트는 이전과 동일한 방법으로 만들면 됩니다.

데이터 로더에서 sampler만 새로 생성된 것을 지정해주면 됩니다.

    sampler = DistributedSampler(dataset=dataset_train, shuffle=True)

    dataloader_train = DataLoader(  dataset_train, 
                                    num_workers=4, 
                                    batch_size=128//4, 
                                    collate_fn=collater, 
                                    pin_memory=True,
                                    sampler=sampler)

세 번째 단계는 모델을 DDP 모드로 설정하는 것입니다.

    # 1번
    retinanet = torch.nn.SyncBatchNorm.convert_sync_batchnorm(retinanet)
    
    # 이 환경변수는 torch.run으로 실행하면 자동적으로 설정되는 것으로 판단됨
    local_rank = int(os.environ['LOCAL_RANK'])  
    
    # 2번
    retinanet = torch.nn.parallel.DistributedDataParallel(retinanet, 
                       device_ids=[local_rank], 
                       find_unused_parameters=True)

1번은 batch normalization 모드를 DDP에 맞춰서 설정하는 것입니다.

2번에서는 모델을 DDP 모드로 맞추고, 이 모델이 어느 GPU에 올라가야 하는지 설정합니다.

find_unused_parameters=True 는, 훈련 중 사용되지 않는 파라미터가 있을 때, 에러가 발생하지 않도록 설정해 줍니다.

네 번째 단계는 훈련단계에서 sampler에게 epoch을 알려줍니다.

    for epoch_num in range(parser.epochs):
        dataloader_train.sampler.set_epoch(epoch_num)

훈련에서 매번 새로운 epoch을 시작할 때 마다, 데이터로더는 자신의 샘플러에게 epoch을 알려줍니다.

아마도, 여러 프로세스들이 데이터세트를 공유하다보니 동기화와 관련된 것 같습니다.

다섯 번째 단계는 훈련된 모델을 저장하는 단계입니다.

모델을 저장하는 것은 하나의 프로세스만 하면 됩니다.

메인프로세스가 하는 것이 적절합니다.

따라서, 메인프로세스를 확인한 후에 모델 저장 명령을 내리면 됩니다.

if torch.distributed.get_rank() == 0:

    torch.save(retinanet.state_dict(), f'./{parser.saved_path}/model_{epoch_num}.pt')

마지막 단계는 훈련을 시작하는 쉘명령어 입니다.

Pytorch 1.9 이상에서는 torchrun 명령어를 이용해서 실행합니다.

torchrun --standalone \
    --nnodes=1 \
    --nproc_per_node=4 \
    _12_train_DDP.py \

--standalone은 다른 서버없이 단독 서버로 훈련하는 것을 의미하는 것 같습니다.

--nnodes는 훈련에 사용되는 서버의 전체 개수입니다.

-- nproc_per_node는 서버에 설치된 GPU의 개수입니다.

마지막에는 수행한 파이썬 코드를 지정합니다.

LIST

저작자표시 비영리 변경금지 (새창열림)

'머신러닝' 카테고리의 다른 글

이름만 간지나는 AI engineering (2)	2025.06.07
파이토치 모델 저장; pytorch model save (0)	2022.11.06
Decision Tree; 결정트리; 의사결정트리 (0)	2022.10.28
파이토치 모델 로딩, pytorch model loading (0)	2022.10.27
Pytorch Simple - 1. Autograd (0)	2019.09.09

Decision Tree; 결정트리; 의사결정트리

동양상인 2022. 10. 28. 20:37

2022. 10. 28. 20:37

Decisioni tree를 이해하기 위해서는 먼저 몇 가지 이해해야 하는 것들이 있습니다.

엔트로피 (entropy) 개념부터 설명하겠습니다.

상상을 해 봅시다.

주머니가 1개 있고, 그 안에 두 가지 종류의 구슬들이 섞여 있다고 합시다.

구슬의 색깔을 빨간색과 흰색으로 상상해 봅시다.

빨간 색과 흰 색의 구슬이 반반씩 섞여있는 경우, 주머니 안을 들여다보면 알록달록해 보일겁니다.

이번에는 빨간 색만 있는 경우를 상상해 보면, 전혀 알록달록 하지 않을 겁니다.

흰 색만 있는 경우도 아주 차분하게, 알록달록 하지 않을 겁니다.

이제 이런 현상에 조금 전문적인 용어를 붙여 봅시다.

알록달록한 정도를 엔트로피 (entropy)라고 합시다.

그러면, 구슬이 반반씩 섞인 경우는 엔트로피가 높다고 할 수 있고,

한 가지 구슬만 있는 경우는 엔트로피가 낮다고 할 수 있다.

즉, 구슬 색깔이 균일할 수록 엔트로피가 낮은 것입니다.

여기서 소개한 용어, Entropy에 대해 직관적으로 이해했기를 바랍니다.

다음에는 엔트로피를 숫자로 표현하는 방법에 대해 다룹니다.

알록달록한 정도, 즉 엔트로피를 숫자로 표현해 보고자 합니다.

엔트로피가 높을 수록 커지는 숫자, 반대는 작아지는 숫자를 만드는 방법이 필요합니다.

이것을 위해서 아래 함수가 필요합니다.

아래 수식과 그래프를 봅시다.

x의 값을 0에서 1.0까지만 고려해 보고, 그 때의 y값을 봅시다.

x가 0에 가까운 값을 가지거나, 1.0에 가까울 때 y값이 작습니다.

x가 0.3 ~ 0.5일때 y값이 큽니다.

이 함수의 특징을 잘 이해해 했으면, 다음으로 넘어갑시다.

이제 구슬과 위 함수를 연결해 봅시다.

x를 주머니 구슬의 비율이라고 합시다.

주머니에는 빨간 색과 흰 색 구슬이 반반 섞여 있으므로, 빨간 색의 비율은 0.5, 흰 색 구슬 비율도 0.5입니다.

이 때, 주머니의 빨간 구슬에 의한 엔트로피를 아래와 같이 표시한다고 합시다.

그런데, 주머니에는 흰 구슬도 있으므로 주머니의 전체 엔트로피는 아래와 같이 표현됩니다.

주머니에 빨간 구슬만 있는 경우,

x = 1.0이 되므로, 흰색은 고려할 필요없이, 엔트로피, 즉 알록달록한 정도는 아래와 같이 0.0이 됩니다.

을 이용하면 주머니 안 구슬배합의 알록달록한 정도를 나타낼 수 있다는 것 감이 잡힐 것입니다. 왜냐하면, 반반씩 섞였을 때 엔트로피는 0.3, 한 가지 구슬만 있을 때는 0.0입니다. 따라서 알록달록할 수록 엔트로피가 커진 것입니다. 다른 비율의 조합들을 시도해 보면 좀 더 이해가 잘 될 겁니다.

주머니와 구슬 비유 안에서 엔트로피를 수학적으로 정의하겠습니다.

주머니 안에 들어있는 색깔별 구슬의 비율을 x_i라고 하면,

그 주머니의 엔트로피는 다음과 같습니다.

예를 들어, x_1은 빨간구슬의 비율, x_2는 흰 구슬의 비율 이렇게 말입니다.

이렇게 정의된 엔트로피는 주머니 안의 구슬 색깔들이 균일할 수록 값이 작습니다.

알록달록할 수록 값이 큽니다.

그래서 엔트로피의 정의는 "무질서도"입니다.

주머니 안에 여러 색깔의 구슬들이 섞여있을수록 무질서하다고 보면 됩니다.

엔트로피 개념에 대해서 직관적으로 이해했으니, decison tree로 다시 돌아가겠습니다.

Decison tree 설명을 위해서 주머니와 구슬 비유를 계속해서 사용하겠습니다.

구슬들이 섞여있는 상황에서 주머니 안에 작은주머니들을 만들고, 구슬들을 나눠서 다시 넣는 상상을 합시다.

아래 그림처럼 말입니다.

작은주머니가 2개 생겼고, 거기에 구슬들을 나눠 담았습니다.

이 때, 작은주머니들의 엔트로피를 구할 수 있을 것입니다.

왼쪽 작은주머니의 엔트로피는 0일 것이고, 오른쪽은 0.3 정도 될 것입니다.

엔트로피가 0이된 왼쪽 주머니는 그대로 두고,

오른쪽 작은주머니 안에 "작은작은주머니들"을 만들어서 구슬을 또 나눠 담을 수 있을 겁니다.

이러한 과정을 엔트로피가 0이 될 때까지 계속해서 반복하다 보면,

새로 만들어진 작은주머니들에는 같은 색깔의 구슬들만 담겨있을 겁니다.

즉, 엔트로피가 0이 된 것입니다

Decision tree의 동작 과정 중 중요한 것은

엔트로피 0를 만드는 것입니다.

즉, 구슬들을 작은주머니들에 나눠담아 가면서, 작은주머니들이 한 가지 색깔의 구슬만 담을 수 있도록 하는 것입니다.

Decision tree의 목적을 알면 왜 이런 과정이 필요한지 이해가 됩니다.

Decision tree는 일반적으로 분류를 하기 위한 방법입니다.

예를 들어서, 메일이 도착했는데 스팸 메일인지 아닌지를 구분한다든지,

제품이 불량인지 양품인지,

꽃의 특성을 보고 어떤 꽃인지 분류하는 일을 하는 것입니다.

여기서 엔트로피 개념이 필요한 이유는,

Decison tree는 분류 결과의 entropy = 0을 만들어 가는 분류 체계를 말합니다.

즉, 같은 것끼리 모아가는 과정을 말합니다.

엔트로피 개념과 decision tree의 기본 동작원리를 설명을 마쳤습니다.

이제는 decision tree를 아주 구체적인 예를 들어서 설명하겠습니다.

메일이 도착했을 때, 스팸 (spam) 메일인지, 아닌지를 구분하는 decision tree를 만들어보겠습니다.

참고로, 스팸메일이 아닌 정상 메일은 햄 (ham )메일이라고 합니다.

Decision tree를 만들기 위해서는 스팸과 햄 메일 관련한 학습데이터가 필요합니다.

학습데이터는 각 메일의 특징을 정리해 두어야 합니다.

여기서는 각 메일의 특징을 3개로 추렸다고 가정하겠습니다.

길이 : long, short, 메일의 길이를 나타내는 두 가지 타입
이미지포함여부 : yes, no 두 가지 타입으로 메일 내에 이미지가 들어 있는지
비트코인 단어 포함여부: yes, no 두가지 타입

아래와 같은 학습데이터를 모았다고 가정하겠습니다.

분류	속성: 길이	속성: 이미지 포함여부	속성: 비트코인 단어 포함여부
Spam	long	Y	Y
Spam	long	N	Y
Spam	long	N	Y
Spam	short	N	N
Spam	long	Y	Y
Ham	long	Y	N
Ham	long	Y	N
Ham	long	Y	N
Ham	short	Y	N
Ham	short	Y	Y

이러한 학습데이터가 주어졌을 때, decision tree는 속성을 기준으로 메일을 나눕니다.

예를 들어, 길이 속성을 기준으로 나눈다면 long과 short 기준에 따라서 메일들을 나눌 것이고,

이미지 포함 여부 속성이라면 Y 또는 N일 것입니다.

어떤 속성을 가지고 나눌지가 핵심인데,

가장 좋은 속성은 Spam과 Ham을 정확하게 구분해 주는 속성이 최고일 것입니다.

그 속성을 찾아내는 방법은,

사용할 수 있는 속성 1) 길이, 2) 이미지, 3) 비트코인에 대해서

각 속성의 값을 기준으로 학습데이터를 나눠보고, 그 분류 안에서 Spam과 Ham이 어느 정도 분리가 되었는지를 평가해서, 가장 분류가 잘 된 것을 기준으로 나누면 될 것입니다.

분류가 잘 되었다는 것은, "덜 알록달록", 즉, "Spam과 Ham"이 덜 섞인 것이므로 엔트로피와 관련이 높습니다.

그렇다면, 정리가 됩니다.

길이 속성값인 long과 short를 기준으로 분류하고, 그 분류된 것에 대해서 엔트로피 값을 구합니다.

마찬가지로 이미지와 비트코인 속성을 기준으로도 엔트로피 값을 구합니다.

그렇게 구해진 엔트로피 값 중에서 최소값을 가지는 속성을 기준으로 일단 메일을 분류하면 되겠습니다.

길이 속성값 long과 short를 기준으로 메일을 분류해 보면 그 결과는 다음과 같습니다.

속성 길이	Spam 비율	Ham 비율	엔트로피
long	4/7	3/7	0.2965
short	1/3	2/3	0.2764

따라서 길이 속성에 따른 엔트로피는 0.2965 + 0.2764가 됩니다.

꽤 높기 때문에 길이는 Spam과 Ham 구분에 별로 도움이 안되는 것을 알 수 있습니다.

이미지 속성값 Y과 N을 기준으로 메일을 분류해 보면 그 결과는 다음과 같습니다.

속성 이미지	Spam 비율	Ham 비율	엔트로피
Y	2/7	5/7	0.2598
N	3/3	0/3	0

이미지 속성에 따른 엔트로피는 0.2598이 됩니다.

비트코인 속성값 Y과 N을 기준으로 메일을 분류해 보면 그 결과는 다음과 같습니다.

속성 이미지	Spam 비율	Ham 비율	엔트로피
Y	4/5	1/5	0.217
N	1/5	4/5	0.217

비트코인에 따른 엔트로피는 0.217 + 0.217입니다.

따라서 이미지 속성에 따른 엔트로피가 가장 낮기 때문에

이미지 속성으로 일단 구분하면 좋을 것 같습니다.

직관적으로 보아도, 이미지가 없는 메일들은 일단 spam 메일로 분류가 됩니다. (물론 현실상황은 그렇지 않지만, 예제를 위해서 그냥 넘어가도록 하겠습니다.)

이렇게 해서 1차적으로 구성된 decision tree는 아래와 같은 모양이 됩니다.

이미지=No인 경우는 모두 spam으로 분류되고,

이미지=Yes인 경우는 ham과 spam이 각각 5개, 2개로 섞여 있게 됩니다.

그러면 다음 단계는, 위 그림에서 왼편 7개 메일에 대해서 entropy를 가장 작게 하는 분류 기준을 찾아내면 됩니다.

물론, 이미지 유무 기준은 더이상 사용할 수 없을 겁니다.

아래 표는 7개 이미지에 대한 데이터만 따로 뽑아 놓은 것입니다.

분류	속성: 길이	속성: 이미지 포함여부	속성: 비트코인 단어 포함여부
Spam	long	Y	Y
Spam	long	Y	Y
Ham	long	Y	N
Ham	long	Y	N
Ham	long	Y	N
Ham	short	Y	N
Ham	short	Y	Y

위의 데이터에 대해서, '길이' 속성과 '비트코인 유무' 속성에 대해서 각각 엔트로피를 계산해 보겠습니다.

첫 번째로, 길이 속성에 대한 entropy는

Long에 대해서는 ham 3개, spam 2개이므로

entropy_long = -(3/5)log(3/5) - (2/5)log(2/5) = 0.29

Short에 대해서는 ham 2개 이므로

entropy_short = 0입니다.

따라서 Entropy_길이 (길이 속성에 대한 entropy) = 0.29입니다.

두 번째로, 비트코인 유무에 대한 entropy는

Yes에 대해서는 ham 1개, spam 2개 이므로

entropy_yes = -(1/3)log(1/3)-(2/3)log(2/4) = 0.27

No에 대해서는 ham 4개이므로,

entorpy_no = 0입니다.

따라서 Entropy_비트코인 (비트코인 단어 유무에 대한 entropy) = 0.27

결론을 내리자면, 비트코인 유무를 판단기준으로 하는 것이 entropy를 낮추는데 도움이 되므로, decision tree의 2번째 단계는 이것을 사용하겠습니다. 이렇게 만들어진 decision tree는 아래와 같습니다.

이제 위 그림의 왼쪽 3개에

ham과 spam이 섞여 있는 것만 풀면 됩니다.

남아있는 데이터는 아래와 같습니다.

분류	속성: 길이	속성: 이미지 포함여부	속성: 비트코인 단어 포함여부
Spam	long	Y	Y
Spam	long	Y	Y
Ham	short	Y	Y

이제 남아 있는 속성은 길이 밖에 없으므로,

적용해 보면

길이=long의 경우, spam만 2개 이므로 entropy = 0

길이=short의 경우, ham만 1개 이므로 entropy = 0

완벽한 분리가 됩니다.

최종적으로 만들어진 decision tree는 아래와 같습니다.

새로운 test data가 주어지면,

이러한 decision tree를 위에서부터 아래로 단계적으로 거쳐 가면서 분류하면 됩니다.

여기서 다룬 decision tree는 매우 간단한 예제에 대한 것인데,

핵심 개념들은 모두 포함하고 있으니,

더 복잡한 경우는 이의 응용으로 보면 되겠습니다.

LIST

저작자표시 비영리 변경금지 (새창열림)

'머신러닝' 카테고리의 다른 글

파이토치 모델 저장; pytorch model save (0)	2022.11.06
파이토치(Pytorch) Distributed Data Parallel (DDP)사용하기 (0)	2022.10.30
파이토치 모델 로딩, pytorch model loading (0)	2022.10.27
Pytorch Simple - 1. Autograd (0)	2019.09.09
사진에 나온 얼굴에서 감정을 읽는 Emotion API (0)	2018.07.22

PREV 이전 1 ···4 5 6 7 8 9 10 ···145 NEXT 다음

소프트웨어 개구리

전체 글

우분투 엔비디아 드라이버 업데이트 업그레이드 Ubuntu Nvidia Driver Update Upgrade

1단계. 사용 가능한 드라이버를 체크합니다.

2단계. 드라이버를 설치합니다.

3단계. 시스템을 재시작합니다.

'리눅스(Linux)' 카테고리의 다른 글

파이토치(Pytorch) Distributed Data Parallel (DDP)사용하기

'머신러닝' 카테고리의 다른 글

Decision Tree; 결정트리; 의사결정트리

'머신러닝' 카테고리의 다른 글

+ Recent posts

티스토리툴바