列出启动服务器的列表并将该列表传递给我的实际剧本？

Question 1

(Ansible is getting stuck executing scp command on that server). If I have some server in that state, why not just Ansible times out and move to other servers?

很可能线性策略

默认情况下，游戏采用线性策略运行，其中所有主机将在任何主机开始下一个任务之前运行每个任务

使用免费策略

这使得每个主持人尽可能快地运行直到游戏结束

- hosts: all
  serial: "{{ num_serial }}"
  strategy: free
  tasks:

尝试异步下面的剧本中有 3 个主机在组“测试”中异步让主机休眠随机数（1-10）秒，并等待 5 秒让主机完成。然后重试一次以收集异步状态并退出播放。下一轮播放本地主机当至少一台主机成功时将会运行并打印每台主机的状态。

- hosts: test
  strategy: free
  vars:
    max_sleep_time: 10
    max_wait_time: 5
  tasks:
    - set_fact:
        my_time: "{{ max_sleep_time|random(start=1) }}"
    - debug:
        msg: "Sleep {{ my_time }} seconds"
    - command: "sleep {{ my_time }}"
      register: play_status
      async: "{{ max_wait_time }}"
      poll: 0
    - async_status:
        jid: "{{ play_status.ansible_job_id }}"
      register: play_status
      until: play_status.finished
      retries: 1

- hosts: localhost
  tasks:
    - debug:
        msg: "{{ item }} finished: {{ hostvars[item].play_status.finished }}"
      loop: "{{ groups['test'] }}"

输出（删节版）显示主机 test_01 和 test_03 休眠了 9 秒，没有及时完成（max_wait_time：5）并且失败了。

TASK [debug]
ok: [test_01] => {
    "msg": "Sleep 9 seconds"
}
ok: [test_02] => {
    "msg": "Sleep 1 seconds"
}
ok: [test_03] => {
    "msg": "Sleep 9 seconds"
}
TASK [async_status]
changed: [test_02]
fatal: [test_01]: FAILED! => {"ansible_job_id": "10701665445.1564", "attempts": 1, "changed": false, "finished": 0, "started": 1}
fatal: [test_03]: FAILED! => {"ansible_job_id": "752000555573.1558", "attempts": 1, "changed": false, "finished": 0, "started": 1}
...
TASK [debug]
ok: [localhost] => (item=test_01) => {
    "msg": "test_01 finished: 0"
}
ok: [localhost] => (item=test_02) => {
    "msg": "test_02 finished: 1"
}
ok: [localhost] => (item=test_03) => {
    "msg": "test_03 finished: 0"
}
...
PLAY RECAP
localhost                  : ok=2    changed=0    unreachable=0    failed=0   
test_01                    : ok=3    changed=1    unreachable=0    failed=1   
test_02                    : ok=4    changed=2    unreachable=0    failed=0   
test_03                    : ok=3    changed=1    unreachable=0    failed=1

设置max_wait_time > max_sleep_time为查看所有主机已完成。

Answer