Microsoft MVP성태의 닷넷 이야기
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일

파이썬 - fork 시 기존 클라이언트 소켓 및 스레드의 동작

지난 글에 설명한 것처럼,

윈도우 개발자를 위한 리눅스 fork 동작 방식 설명 (파이썬 코드)
; https://www.sysnet.pe.kr/2/0/12811

fork는 현재 프로세스의 메모리 그대로 복사해 실행하는데, 그렇다면 해당 프로세스에서 이미 연결해 두었던 클라이언트 소켓은 어떻게 되는 걸까요? 이론상으로는 fork된 프로세스에서도 유효한 소켓 descriptor이기 때문에 부모 프로세스와 전혀 다르지 않게 통신을 해야 할 것입니다.

정말 그런지 테스트를 해볼까요? ^^

이를 위해 다음과 같이 간단하게 파이썬 예제 코드를 만들고,

import os
import socket
import struct
import time
from threading import Thread, Timer

log_socket = None


class LogSocket:
    def __init__(self, port, address=None):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if address is None:
            address = "127.0.0.1"

        self.address = address
        self.port = port

        self.sock.connect((self.address, self.port))
        pid = os.getpid()
        buf = struct.pack('i', pid)
        self.sock.send(buf)

    def log(self, text):
        buf = struct.pack('i', len(text))
        self.sock.send(buf)

        self.sock.send(text.encode('utf-8'))

    def close(self):
        self.sock.close()


log_socket = LogSocket(39999)
pid = os.fork()

if pid > 0:
    print('부모 프로세스의 실행 흐름', os.getpid())
elif pid == 0:
    print('자식 프로세스의 실행 흐름', os.getpid())
else:  # pid < 0
    print('fork 오류')

while True:
    time.sleep(1)
    log_socket.log("current pid: " + str(os.getpid()))

(첨부 파일로 포함한 C# TCP 서버 프로그램을 마련한 후) 실행해 TCP 서버 측에서 수신하는 데이터를 보면,

$ python main.py
부모 프로세스의 실행 흐름 17120
자식 프로세스의 실행 흐름 17121

/*
pstree -p | grep main.py
*/

// TCP 서버 측 수신 데이터

current pid: 17120
current pid: 17121
...[이하 반복]...

단일 소켓 연결을 사용해 (fork 중인) 부모와 자식 프로세스 모두 TCP 서버와 통신하는 것을 확인할 수 있습니다.




fork로 인한 부모/자식이 소켓 하나를 공유해 사용하고 있지만, 네트워크의 특성을 고려해 저것이 2개로 나뉠 수 있다는 것을 감안해야 합니다.

가령, fork 이후 서버 측과의 소켓 통신이 끊겨서 재연결을 하는 경우라고 가정해 보겠습니다. 그렇다면, 기존에는 1개의 소켓을 공유했지만, 소켓이 끊기게 되면 이후 부모/자식 프로세스가 모두 각각 소켓 통신을 열게 되므로 2개의 소켓이 사용될 수 있습니다.

역시 간단하게 이전에 사용한 코드 중 LogSocket 관련 코드만 다음과 같이 바꾸고,

class LogSocket:
    def __init__(self, port, address=None):
        self.sock = None
        self.address = address
        self.port = port

        self.reconnect()

    def reconnect(self):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if self.address is None:
            self.address = "127.0.0.1"

        self.sock.connect((self.address, self.port))
        process_id = os.getpid()
        buf = struct.pack('i', process_id)
        self.sock.send(buf)

    def log(self, text):

        try:
            buf = struct.pack('i', len(text))
            self.sock.send(buf)

            self.sock.send(text.encode('utf-8'))
        except:
            self.reconnect()

    def close(self):
        self.sock.close()

테스트하면, 최초 실행 시 1개의 소켓으로 공유하는 중에 서버 측에서 강제로 해당 연결을 끊어버리면 fork의 부모/자식 프로세스가 reconnect 함수를 각각 실행하면서 별도의 소켓 연결을 가져가게 됩니다.

사실, fork의 이런 동작은 전체적인 프로그램에 대한 코드 실행 경로를 자칫 난해하게 만들 수 있으므로 사용하는 유형이 정해져 있습니다. 대표적인 사례로 TCP 서버에서 클라이언트가 접속했을 때 해당 소켓과 통신하는 전용 프로세스를 fork로 만들어 떼어내는 것입니다.

또한 전에도 언급했지만, 파이썬의 경우 유독 GIL(Global Interpreter Lock)로 인해 fork와 친해질 수밖에 없는 구조입니다. 이로 인해 Django를 호스팅하는 uwsgigunicorn에서 요청이 오면 그것을 처리하기 위한 (별도 스레드가 아닌) fork로 자식 프로세스를 만들게 된 것입니다. (물론, --worker-class=gthread 등의 옵션이 있지만!)




그렇다면 스레드는 어떻게 될까요? 원칙상으로 보면, 소켓이나 스레드와 같은 커널 자원이 fork로 자식 프로세스에 복제되는 것은 엄밀히 핸들 값에 불과할 뿐입니다. 그렇기 때문에 소켓의 경우는 부모/자식에서 모두 (피동적으로) 사용할 수 있었지만, 스레드의 경우에는 fork된 자식 프로세스에서 딱히 역할을 하지 않습니다.

역시 간단하게 이전의 파이썬 코드에서 스레드만 추가해 다음과 같이 확인할 수 있습니다.

import os
import socket
import struct
import threading
import time
from threading import Thread, Timer

log_socket = None


class LogSocket:
    def __init__(self, port, address=None):
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        if address is None:
            address = "127.0.0.1"

        self.address = address
        self.port = port

        self.sock.connect((self.address, self.port))
        pid = os.getpid()
        buf = struct.pack('i', pid)
        self.sock.send(buf)

    def log(self, text):
        buf = struct.pack('i', len(text))
        self.sock.send(buf)

        self.sock.send(text.encode('utf-8'))

    def close(self):
        self.sock.close()


def run_thread():
    def handler():
        global log_socket

        while True:
            log_socket.log("current pid: " + str(os.getpid()) + ", " + str(threading.get_native_id()))
            time.sleep(1)

    t = Thread(target=handler)
    t.daemon = True
    t.start()
    return t


log_socket = LogSocket(39999)
run_thread()

pid = os.fork()

if pid > 0:
    print('부모 프로세스의 실행 흐름', os.getpid())
elif pid == 0:
    print('자식 프로세스의 실행 흐름', os.getpid())
else:  # pid < 0
    print('fork 오류')

while True:
    time.sleep(1)

실행해 보면 파이썬 콘솔에는 2개의 프로세스 id가 보이고 TCP 서버에서는 단일 소켓으로 1초마다 들어오는 메시지를 확인할 수 있습니다.

$ python main.py
부모 프로세스의 실행 흐름 17109
자식 프로세스의 실행 흐름 17111

// TCP 서버 측 수신 데이터

current pid: 17109, 17110
current pid: 17109, 17110
...[이하 반복]...

pid를 보면 알겠지만, 부모 프로세스가 17109이고 그 프로세스에서 생성한 스레드가 17110, 마지막으로 fork 프로세스가 17111로 할당돼 있습니다.

(첨부 파일은 이 글에서 사용한 파이썬 예제 코드와 C# TCP 서버를 포함합니다.)




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]



donaricano-btn



[최초 등록일: ]
[최종 수정일: 10/6/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 쓴 사람
 




[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
12868정성태12/7/202116오류 유형: 770. twine 업로드 시 "HTTPError: 400 Bad Request ..." 오류
12867정성태12/7/202128개발 환경 구성: 612. 파이썬 - PyPI 패키지 만들기 (3) entry_points 옵션
12866정성태12/7/202115오류 유형: 769. "docker build ..." 시 "failed to solve with frontend dockerfile.v0: failed to read dockerfile ..." 오류
12865정성태12/6/202129개발 환경 구성: 611. 파이썬 - PyPI 패키지 만들기 (2) long_description, cmdclass 옵션
12864정성태12/6/202140Linux: 46. WSL 환경에서 find 명령을 사용해 파일을 찾는 방법
12863정성태12/4/202151개발 환경 구성: 610. 파이썬 - PyPI 패키지 만들기
12862정성태12/3/202146오류 유형: 768. Golang - 빌드 시 "cmd/go: unsupported GOOS/GOARCH pair linux /amd64" 오류
12861정성태12/3/202162개발 환경 구성: 609. 파이썬 - "Windows embeddable package"로 개발 환경 구성하는 방법
12860정성태12/1/2021119오류 유형: 767. SQL Server - 127.0.0.1로 접속하는 경우 "Access is denied"가 발생한다면?
12859정성태12/1/2021134개발 환경 구성: 608. Hyper-V 가상 머신에 Console 모드로 로그인하는 방법
12858정성태11/30/2021318개발 환경 구성: 607. 로컬의 USB 장치를 원격 머신에 제공하는 방법 - usbip-win
12857정성태11/24/2021112개발 환경 구성: 606. WSL Ubuntu 20.04에서 파이썬을 위한 uwsgi 설치 방법
12856정성태11/23/2021334.NET Framework: 1121. C# - 동일한 IP:Port로 바인딩 가능한 서버 소켓 [2]
12855정성태11/13/2021111개발 환경 구성: 605. Azure App Service - Kudu SSH 환경에서 FTP를 이용한 파일 전송
12854정성태11/13/2021230개발 환경 구성: 604. Azure - 윈도우 VM에서 FTP 여는 방법
12853정성태11/10/2021137오류 유형: 766. Azure App Service - JBoss 호스팅 생성 시 "This region has quota of 0 PremiumV3 instances for your subscription. Try selecting different region or SKU."
12851정성태11/1/2021236스크립트: 34. 파이썬 - MySQLdb 기본 예제 코드
12850정성태10/27/2021514오류 유형: 765. 우분투에서 pip install mysqlclient 실행 시 "OSError: mysql_config not found" 오류
12849정성태10/17/2021517스크립트: 33. JavaScript와 C#의 시간 변환
12848정성태10/17/2021475스크립트: 32. 파이썬 - sqlite3 기본 예제 코드
12847정성태10/14/2021428스크립트: 31. 파이썬 gunicorn - WORKER TIMEOUT 오류 발생
12846정성태10/7/2021524스크립트: 30. 파이썬 __debug__ 플래그 변수에 따른 코드 실행 제어
12845정성태10/6/2021892.NET Framework: 1120. C# - BufferBlock<T> 사용 예제 [4]파일 다운로드1
12844정성태10/3/2021445오류 유형: 764. MSI 설치 시 "... is accessible and not read-only." 오류 메시지
12843정성태10/3/2021488스크립트: 29. 파이썬 - fork 시 기존 클라이언트 소켓 및 스레드의 동작파일 다운로드1
[1]  2  3  4  5  6  7  8  9  10  11  12  13  14  15  ...