ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Airflow-(celeryexecutor)
    데이터엔지니어링/Airflow 2023. 5. 7. 22:08

    VMware(Ubuntu)에서 진행 - 단일 노드로 구성 - 


    sudo apt upgrade로 실제 업그레이드 가능한 패키지 업그레이드


    sudo apt-get install postgresql로 postgre DB 설치하기


    sudo su - postgres를 치고 psql을 쳐서 postgres DB접속


    airflow_db라는 데이터베이스 만들어주기

    유저 : airflow, 비밀번호 airflow로 유저 생성


    pip install apache-airflow로 airflow 설치하기

     유저 : airflow, 비밀번호 : airflow, 권한 : Admin로 유저 생성


     

    sudo apt upgrade 후에 sudo apt install rabbitmq-server를 다운로드한다


    유저 이름 : admin, 비밀번호 : admin 유저 생성

    airflow_vhost 생성

    tag 달아주기

    퍼미션 세팅해주기

     


    airflow폴더에 들어가서 airflow.cfg 파일을 수정해야한다.

    sql_alchemy_conn = postgresql+psycopg2://airflow:airflow@localhost/airflow_db
    
    # 이후에 psycopg2를 pip 하면 되는데, psycopg2 말고 psycopg2-binary로 깔면 잘 되더라..
    
    executor = CeleryExecutor
    
    broker_url = amqp://admin:admin@localhost:5672/airflow_vhost
    
    # port는 rabbitmq의 port
    
    result_backend = amqp://admin:admin@localhost:5672/airflow_vhost
    
    # broker_url과 동일

     


    db init을 하지 않고 하니까. 아래 데이터베이스 확인하라는 문구가 뜨긴했다.

    rabbitmq-server
    airflow celery worker
    airflow webserver
    airflow scheduler
    
    # 차례로 켜주면 된다

    example dag들이 보인다.

    airflow.cfg 설정에서 삭제할 수 있다.

    load_example = True를 False로 바꾸면 된다.

     


    CeleryExecutor인걸 확인 할 수 있다.

    '데이터엔지니어링 > Airflow' 카테고리의 다른 글

    GCP VM으로 Airflow 구축하기  (0) 2023.06.04
    Airflow(celeryexecutor - docker-compose)  (1) 2023.05.13
    Airflow 간단 개념  (0) 2023.05.03
Designed by Tistory.