当前位置:首页 > 技术分析 > 正文内容

如何用多线程优化for循环

ruisui881个月前 (03-28)技术分析10

for 循环是编程的一个基本方面,它允许我们迭代序列并高效地执行操作。然而,在处理耗时任务时,for 循环的顺序性质可能成为瓶颈。一个解决方案是使用线程。学习:如何使用、何时使用以及何时不使用线程。

让我们从一个例子开始。我们将伪造并模拟一个耗时的任务。我们将使用一个 Python 脚本,该脚本通过 for 循环对数字列表进行处理,通过 square_number 函数将每个数字平方:

import time

# List of numbers to process
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# Function to square a number
def square_number(number):
    time.sleep(1)  # Simulate a time-consuming task
    return number * number

# Using a for loop to process each number
squared_numbers = []
start_time = time.time()
for number in numbers:
    squared_numbers.append(square_number(number))

end_time = time.time()

print("Squared numbers:", squared_numbers)
print("Time taken:", end_time - start_time, "seconds")
# Time taken: 10.082990884780884 seconds

这个脚本按顺序处理列表中的每个数字,由于 square_number 函数中的 time.sleep(1) 调用,每个数字耗时 1 秒。总执行时间为 10.1 秒。

使用多线程优化

接下来,我们将使用多线程方法来优化这一点,以改善处理时间。为了使用多线程优化上述示例,我们可以使用 Python 的 concurrent.futures 模块,它为异步执行可调用对象提供了一个高级接口。以下是如何修改脚本以使用多线程:

import time
from concurrent.futures import ThreadPoolExecutor

# List of numbers to process
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# Function to square a number
def square_number(number):
    time.sleep(1)  # Simulate a time-consuming task
    return number * number

# Using ThreadPoolExecutor for multithreading
squared_numbers = []
start_time = time.time()

with ThreadPoolExecutor(max_workers=10) as executor:
    results = executor.map(square_number, numbers)

# Collect the results
squared_numbers = list(results)

end_time = time.time()

print("Squared numbers:", squared_numbers)
print("Time taken:", end_time - start_time, "seconds")
# Time taken: 2.0257720947265625 seconds

在这个优化的脚本中,我们使用 ThreadPoolExecutor 创建一个线程池。executor.map 函数将 square_number 函数分布到线程中,以并行方式处理数字。通过将 max_workers 设置为 5,我们允许最多 5 个线程同时运行,这应该会显著减少总处理时间。请随意调整 max_workers 参数,以找到特定用例的最佳线程数。

何时使用多线程

正如你所见,多线程可以在各种场景中提供显著的速度提升。但它并不适用于所有任务。以下是多线程特别有益的一些典型用例:

  1. I/O 绑定任务:
  • 文件 I/O:读取和写入文件,特别是处理大文件或多个文件时。
  • 网络 I/O:同时处理多个网络连接,例如网络抓取、下载文件或处理 web 服务器中的请求。
  • 数据库操作:执行 I/O 绑定的数据库查询,例如获取或更新大型数据集。
  1. 并发任务:
  • 据处理:实时处理来自多个传感器或流的数据,例如在 IoT 应用中。
  • GUI 应用程序:通过在后台运行耗时任务,保持用户界面的响应性。
  1. 独立任务的并行处理:
  • 批量处理:处理大量可以并行执行的独立任务,例如图像处理或数据转换任务。
  • 模拟:同时运行多个模拟或蒙特卡洛实验。

何时不使用多线程

虽然多线程可以提供显著的速度提升,但它并不总是每个问题的最好解决方案。以下是它可能不适用的一些场景:

  • CPU 绑定任务:如果任务严重依赖 CPU 并且不涉及太多等待(如纯数学计算),使用 multiprocessing 模块创建单独的进程可能更有效。
  • 全局解释器锁 (GIL):在 CPython 中,全局解释器锁可能会限制多线程在 CPU 绑定任务中的性能提升。在这种情况下,多进程或使用没有 GIL 的实现,如 Jython 或 IronPython,可能更有效。
  • 复杂的共享状态:跨多个线程管理复杂的共享状态可能会引入与竞态条件、死锁和线程安全性相关的挑战和错误。

通过了解任务的性质和潜在瓶颈,你可以决定多线程是否是应用程序的适当解决方案。

专业提示 — 使用装饰器

装饰器可以用来以更优雅和可重用的方式为函数添加多线程。装饰器是一个函数,它接受另一个函数并扩展其行为,而不需要显式修改它。

import time
from concurrent.futures import ThreadPoolExecutor, as_completed

# Decorator to add multithreading
def multithreaded(max_workers=5):
    def decorator(func):
        def wrapper(*args, **kwargs):
            with ThreadPoolExecutor(max_workers=max_workers) as executor:
                future_to_args = {executor.submit(func, arg): arg for arg in args[0]}
                results = []
                for future in as_completed(future_to_args):
                    arg = future_to_args[future]
                    try:
                        result = future.result()
                    except Exception as exc:
                        print(f'{arg} generated an exception: {exc}')
                    else:
                        results.append(result)
                return results
        return wrapper
    return decorator

# Function to square a number
@multithreaded(max_workers=5)
def square_number(number):
    time.sleep(1)  # Simulate a time-consuming task
    return number * number

# List of numbers to process
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# Using the decorated function
start_time = time.time()
squared_numbers = square_number(numbers)
end_time = time.time()

print("Squared numbers:", squared_numbers)
print("Time taken:", end_time - start_time, "seconds")

使用装饰器处理多线程不仅简化了代码,还使其更可重用和更清晰。你可以轻松地将 @multithreaded 装饰器应用于任何需要并行执行的函数,为优化你的 Python 代码提供了一种灵活而强大的方式。

结论

多线程是优化 Python 中 for 循环的强大工具,特别是对于 I/O 绑定和并发任务。通过利用 concurrent.futures 模块,你可以显著减少处理时间并提高程序的效率。然而,评估你的特定用例以确定多线程是否是最佳方法至关重要,特别是当你处理 CPU 绑定任务或复杂的共享状态时。通过仔细考虑和实施,多线程可以大大增强你的应用程序的性能。

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/3092.html

标签: 线程优化
分享给朋友:

“如何用多线程优化for循环” 的相关文章

「2022」打算跳槽涨薪,必问面试题及答案——VUE篇

1、为什么选择VUE,解决了什么问题?vue.js 正如官网所说的,是一套构建用户界面的渐进式框架。与其它重量级框架不同的是,vue 被设计为可以自底向上逐层应用。vue 的核心库只关注视图层,不仅易于上手,还便于与第三方库或既有项目整合。另外一方面,当与现代化工具链以及各种支持类库结合使用时,vu...

学无止境:Git 如何优雅地回退代码

来源:https://zhenbianshu.github.io前言从接触编程就开始使用 Git 进行代码管理,先是自己玩 Github,又在工作中使用 Gitlab,虽然使用时间挺长,可是也只进行一些常用操作,如推拉代码、提交、合并等,更复杂的操作没有使用过,看过的教程也逐渐淡忘了,有些对不起 L...

壹啦罐罐 Android 手机里的 Xposed 都装了啥

这是少数派推出的系列专题,叫做「我的手机里都装了啥」。这个系列将邀请到不同的玩家,从他们各自的角度介绍手机中最爱的或是日常使用最频繁的 App。文章将以「每周一篇」的频率更新,内容范围会包括 iOS、Android 在内的各种平台和 App。本期继续歪楼,由少数派撰稿作者@壹啦罐罐介绍他正在使用的...

VUE-router

七.Vue-router1、什么是vue-routervue-router是vue.js官方路由管理器。vue的单页应用是基于路由和组件的,路由用于设定访问路径,并将路径和组件映射起来。传统页面切换是用超链接a标签进行切换。但vue里是用路由,因为我们用Vue做的都是单页应用,就相当于只有一个主的i...

从 Vue2.0 到 React17——React 开发入门

作者:佚名来源:前端大全前言找工作时发现有一些公司是以React作为技术栈的,而且薪资待遇都不错,为了增加生存的筹码,所以还是得去学一下React,增加一项求生技能。因为我用Vue2.0开发项目已经四年了,故用Vue2.0开发项目的思路来学习React。前端项目是由一个个页面组成的,对于Vue来说,...

vue2中路由的使用步骤,你学会了吗?

今天我们来整理下关于vue2中路由的使用步骤:1. 导入 vue 文件和Vue-router文件(注意:vue-router是依赖vue运行的,所以一定在vue后引入vue-router)2. 定义路由组件模板3. 创建路由实例并定义路由规则4. 将路由实例挂载给Vue实例5. 在结构区域定义控制路...