Merge branch 'master' of https://github.com/simple-rules/harmony-benchmark

6 years ago · 38cdeaaf6f
parent 9de5e365c9 3c3eded21a
commit 38cdeaaf6f
3 changed files with 234 additions and 26 deletions
--- a/aws-experiment-launch/collect_public_ips.py
+++ b/aws-experiment-launch/collect_public_ips.py
@ -1,22 +1,30 @@
 import argparse
+import os
 import sys

 from utils import utils

 if __name__ == "__main__":
    parser = argparse.ArgumentParser(description='This script helps you to collect public ips')
-    parser.add_argument('--region', type=str, dest='region_number',
-                        default="4", help="region number")
-    parser.add_argument('--node_name_tag', type=str,
-                        dest='node_name_tag', default='4-NODE-23-36-01-2018-07-05')
+    parser.add_argument('--instance_output', type=str, dest='instance_output',
+                        default='instance_output.txt',
+                        help='the file contains node_name_tag and region number of created instances.')
    parser.add_argument('--region_config', type=str,
                        dest='region_config', default='configuration.txt')
    parser.add_argument('--file_output', type=str,
                        dest='file_output', default='raw_ip.txt')
    args = parser.parse_args()

-    ip_list = utils.collect_public_ips(args.region_number, args.node_name_tag, args.region_config)
-    with open(args.file_output, "w") as fout:
-        for ip in ip_list:
-            fout.write(ip + " " + args.node_name_tag + "\n")
-    print "Done writing %s" % args.file_output
+    if not args.instance_output or not args.instance_output or not os.path.isfile(args.instance_output):
+        print "%s or %s are not existed" % (args.file_output, args.instance_output)
+        sys.exit(1)
+    if args.instance_output:
+        with open(args.instance_output, "r") as fin, open(args.file_output, "w") as fout:
+            for line in fin.readlines():
+                items = line.split(" ")
+                region_number = items[1].strip()
+                node_name_tag = items[0].strip()
+                ip_list = utils.collect_public_ips(region_number, node_name_tag, args.region_config)
+                for ip in ip_list:
+                    fout.write(ip + " " + node_name_tag + "\n")
+        print "Done collecting public ips %s" % args.file_output
--- a/aws-experiment-launch/create_and_deploy_minh.py
+++ b/aws-experiment-launch/create_and_deploy_minh.py
@ -18,16 +18,10 @@ class InstanceResource:
 with open("user-data.sh", "r") as userdata_file:
    USER_DATA = userdata_file.read()

-# UserData must be base64 encoded for spot instances.
-USER_DATA_BASE64 = base64.b64encode(USER_DATA)
-
 IAM_INSTANCE_PROFILE = 'BenchMarkCodeDeployInstanceProfile'
-REPO = "simple-rules/harmony-benchmark"
-APPLICATION_NAME = 'benchmark-experiments'
 time_stamp = time.time()
 CURRENT_SESSION = datetime.datetime.fromtimestamp(
    time_stamp).strftime('%H-%M-%S-%Y-%m-%d')
-PLACEMENT_GROUP = "PLACEMENT-" + CURRENT_SESSION
 NODE_NAME_SUFFIX = "NODE-" + CURRENT_SESSION

 def run_one_region_instances(config, region_number, number_of_instances, instance_resource=InstanceResource.ON_DEMAND):
@ -38,11 +32,12 @@ def run_one_region_instances(config, region_number, number_of_instances, instanc
    ec2_client = session.client('ec2')

    if instance_resource == InstanceResource.ON_DEMAND:
-        return create_instances(
+        node_name_tag = create_instances(
            config, ec2_client, region_number, int(number_of_instances))
        print("Created %s in region %s" % (node_name_tag, region_number))
+        return node_name_tag
    else:
-        return False
+        return None


 def create_instances(config, ec2_client, region_number, number_of_instances):
@ -85,10 +80,10 @@ def create_instances(config, ec2_client, region_number, number_of_instances):
        ip_list = utils.collect_public_ips_from_ec2_client(ec2_client, node_name_tag)
        if len(ip_list) == number_of_instances:
            print("Created %d instances" % number_of_instances)
-            return True
+            return node_name_tag
        count = count + 1
    print("Can not create %d instances" % number_of_instances)
-    return False
+    return None

 if __name__ == "__main__":
    parser = argparse.ArgumentParser(
@ -99,16 +94,21 @@ if __name__ == "__main__":
                        default='1', help='number of instances')
    parser.add_argument('--configuration', type=str,
                        dest='config', default='configuration.txt')
+    parser.add_argument('--instance_output', type=str, dest='instance_output',
+                        default='instance_output.txt', help='the file to append or write')
    args = parser.parse_args()
    config = utils.read_region_config(args.config)
    region_list = args.regions.split(',')
    instances_list = args.numInstances.split(',')
    assert len(region_list) == len(instances_list), "number of regions: %d != number of instances per region: %d" % (len(region_list), len(instances_list))

-    for i in range(len(region_list)):
-        region_number = region_list[i]
-        number_of_instances = instances_list[i]
-        if run_one_region_instances(config, region_number, number_of_instances, InstanceResource.ON_DEMAND):
-            print("Created instances for region %s" % region_number )
-        else:
-            print("Failed to create instances for region %s" % region_number )
+    with open(args.instance_output, "a") as fout:
+        for i in range(len(region_list)):
+            region_number = region_list[i]
+            number_of_instances = instances_list[i]
+            node_name_tag = run_one_region_instances(config, region_number, number_of_instances, InstanceResource.ON_DEMAND)
+            if node_name_tag:
+                print("Managed to create instances for region %s" % region_number )
+                fout.write("%s %s\n" % (node_name_tag, region_number))
+            else:
+                print("Failed to create instances for region %s" % region_number )
--- a/aws-experiment-launch/deploy.py
+++ b/aws-experiment-launch/deploy.py
@ -0,0 +1,200 @@
+import boto3
+import argparse
+import sys
+import json
+import time
+import datetime
+from threading import Thread
+from Queue import Queue
+import base64
+
+from utils import utils
+
+class InstanceResource:
+    ON_DEMAND = 1
+    SPOT_INSTANCE = 2
+    SPOT_FLEET = 3
+
+with open("user-data.sh", "r") as userdata_file:
+    USER_DATA = userdata_file.read()
+
+# UserData must be base64 encoded for spot instances.
+USER_DATA_BASE64 = base64.b64encode(USER_DATA)
+
+IAM_INSTANCE_PROFILE = 'BenchMarkCodeDeployInstanceProfile'
+REPO = "simple-rules/harmony-benchmark"
+APPLICATION_NAME = 'benchmark-experiments'
+time_stamp = time.time()
+CURRENT_SESSION = datetime.datetime.fromtimestamp(
+    time_stamp).strftime('%H-%M-%S-%Y-%m-%d')
+PLACEMENT_GROUP = "PLACEMENT-" + CURRENT_SESSION
+NODE_NAME_SUFFIX = "NODE-" + CURRENT_SESSION
+
+def run_one_region_codedeploy(region_number, commit_id):
+    #todo: explore the use ec2 resource and not client. e.g. create_instances --  Might make for better code.
+    """
+    for getting instance ids:---
+    ec2 = boto3.resource('ec2', region_name=region_name])
+    result = ec2.instances.filter(Filters=[{'Name': 'instance-state-name', 'Values': ['running']}])
+    for instance in result:
+        instances.append(instance.id)
+    
+    for getting public ips : --
+        ec2 = boto3.resource('ec2')
+        instance
+    """
+    region_name = config[region_number][REGION_NAME]
+    NODE_NAME = region_number + "-" + NODE_NAME_SUFFIX
+    session = boto3.Session(region_name=region_name)
+    ec2_client = session.client('ec2')
+    filters = [{'Name': 'tag:Name','Values': [NODE_NAME]}]
+    instance_ids = get_instance_ids(ec2_client.describe_instances(Filters=filters))
+    
+    print("Number of instances: %d" % len(instance_ids))
+
+    print("Waiting for all %d instances in region %s to start running"%(len(instance_ids),region_number))
+    waiter = ec2_client.get_waiter('instance_running')
+    waiter.wait(InstanceIds=instance_ids)
+
+    print("Waiting for all %d instances in region %s to be INSTANCE STATUS OK"%(len(instance_ids),region_number))
+    waiter = ec2_client.get_waiter('instance_status_ok')
+    waiter.wait(InstanceIds=instance_ids)
+
+    print("Waiting for all %d instances in region %s to be SYSTEM STATUS OK"%(len(instance_ids),region_number))
+    waiter = ec2_client.get_waiter('system_status_ok')
+    waiter.wait(InstanceIds=instance_ids)
+
+    codedeploy = session.client('codedeploy')
+    application_name = APPLICATION_NAME
+    deployment_group = APPLICATION_NAME + "-" + str(commit_id)[6] + "-" + CURRENT_SESSION
+    repo = REPO
+
+    print("Setting up to deploy commit_id %s on region %s"%(commit_id,region_number))
+    response = get_application(codedeploy, application_name)
+    deployment_group = get_deployment_group(
+        codedeploy, region_number, application_name, deployment_group)
+    depId = deploy(codedeploy, application_name,
+                   deployment_group, repo, commit_id)
+    return region_number, depId
+
+
+def get_deployment_group(codedeploy, region_number,application_name, deployment_group):
+    NODE_NAME = region_number + "-" + NODE_NAME_SUFFIX
+    response = codedeploy.create_deployment_group(
+        applicationName=application_name,
+        deploymentGroupName=deployment_group,
+        deploymentConfigName='CodeDeployDefault.AllAtOnce',
+        serviceRoleArn='arn:aws:iam::656503231766:role/BenchMarkCodeDeployServiceRole',
+        deploymentStyle={
+            'deploymentType': 'IN_PLACE',
+            'deploymentOption': 'WITHOUT_TRAFFIC_CONTROL'
+        },
+        ec2TagFilters = [
+            {
+                'Key': 'Name',
+                'Value': NODE_NAME,
+                'Type': 'KEY_AND_VALUE'
+            }
+        ]
+    )
+    return deployment_group
+
+
+def get_application(codedeploy, application_name):
+    response = codedeploy.list_applications()
+    if application_name in response['applications']:
+        return response
+    else:
+        response = codedeploy.create_application(
+            applicationName=application_name,
+            computePlatform='Server'
+        )
+    return response
+
+
+def deploy(codedeploy, application_name, deployment_group, repo, commit_id):
+    """Deploy new code at specified revision to instance.
+
+    arguments:
+    - repo: GitHub repository path from which to get the code
+    - commit_id: commit ID to be deployed
+    - wait: wait until the CodeDeploy finishes
+    """
+    print("Launching CodeDeploy with commit " + commit_id)
+    res = codedeploy.create_deployment(
+        applicationName=application_name,
+        deploymentGroupName=deployment_group,
+        deploymentConfigName='CodeDeployDefault.AllAtOnce',
+        description='benchmark experiments',
+        revision={
+            'revisionType': 'GitHub',
+            'gitHubLocation': {
+                    'repository': repo,
+                    'commit_id': commit_id,
+            }
+        }
+    )
+    depId = res["deploymentId"]
+    print("Deployment ID: " + depId)
+    # The deployment is launched at this point, so exit unless asked to wait
+    # until it finishes
+    info = {'status': 'Created'}
+    start = time.time()
+    while info['status'] not in ('Succeeded', 'Failed', 'Stopped',) and (time.time() - start < 600.0):
+        info = codedeploy.get_deployment(deploymentId=depId)['deploymentInfo']
+        print(info['status'])
+        time.sleep(15)
+    if info['status'] == 'Succeeded':
+        print("\nDeploy Succeeded")
+        return depId
+    else:
+        print("\nDeploy Failed")
+        print(info)
+        return depId
+
+def run_one_region_codedeploy_wrapper(region_number, commit_id, queue):
+    region_number, depId = run_one_region_codedeploy(region_number, commit_id)
+    queue.put((region_number, depId))
+
+def launch_code_deploy(region_list, commit_id):
+    queue = Queue()
+    jobs = []
+    for i in range(len(region_list)):
+        region_number = region_list[i]
+        my_thread = Thread(target=run_one_region_codedeploy_wrapper, args=(
+            region_number, commit_id, queue))
+        my_thread.start()
+        jobs.append(my_thread)
+    for my_thread in jobs:
+        my_thread.join()
+    results = [queue.get() for job in jobs]
+    return results
+
+def get_instance_ids(describe_instances_response):
+    instance_ids = []
+    for reservation in describe_instances_response["Reservations"]:
+        for instance in reservation["Instances"]:
+            instance_ids.append(instance["InstanceId"])
+    return instance_ids
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser(
+        description='This script helps you start instances across multiple regions')
+    parser.add_argument('--regions', type=str, dest='regions',
+                        default='3', help="Supply a csv list of all regions")
+    parser.add_argument('--instances', type=str, dest='numInstances',
+                        default='1', help='number of instances')
+    parser.add_argument('--configuration', type=str,
+                        dest='config', default='configuration.txt')
+    parser.add_argument('--commit_id', type=str, dest='commit_id',
+                        default='1f7e6e7ca7cf1c1190cedec10e791c01a29971cf')
+    args = parser.parse_args()
+    config = utils.read_region_config(args.config)
+    region_list = [item.strip() for item in args.regions.split(',')]
+    instances_list = [item.strip() for item in args.numInstances.split(',')]
+    assert len(region_list) == len(instances_list), "number of regions: %d != number of instances per region: %d" % (
+        len(region_list), len(instances_list))
+    commit_id = args.commit_id
+
+    results = launch_code_deploy(region_list, commit_id)
+    print(results)