彩票驿站 - 彩票驿站
彩票驿站2023-10-26

彩票驿站

向善而生的AI助盲,让AI多一点,障碍少一点******

  有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。

  新契机:多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。

  一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。

  多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。

  大挑战:如何看到盲人“眼中”的千人千面

  AI助盲看似简单,但多模态算法依然面临重大挑战。

  多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。

  另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。

  另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。

  最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。

  多解法:浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。

  盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。

  真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。

Z世代助力海派民乐燃放中国自信******

  作者:姜 方

  不久前的B站《2023年跨年晚会最美的夜》,由“上美影宇宙”带来的节目《中国人不蹦洋迪》冲上微博热搜,仅在B站点击量就破百万。节目以《大闹天宫》动画开场,伴随嘹亮的唢呐声,场上奏起佤族民歌,融入电音的传统乐器燃情合奏,加上还原《大闹天宫》《哪吒闹海》《牧童》《葫芦兄弟》等“上海出品”动画画面,令不少网友叹为观止。“《天庭蹦迪》《大圣打碟》我愿称作全场最佳”“指挥:托塔李天王”“神仙蹦迪现场”……年轻网友在B站弹幕里,表达了他们对中国动画和创意民乐的认同。

  卡塔尔世界杯期间,自得琴社创制的世界杯主题曲视频在海内外视频平台获得了数十万网友点赞。 (自得琴社供图)

  眼下,越来越多来自Z世代的创意与活力,助力古老民乐在不断更新中燃放文化自信。去年卡塔尔世界杯举行期间,活跃在上海的民乐团体自得琴社创制的世界杯主题曲视频,在海内外视频平台获得了数十万网友的点赞。“知识与趣味并重!看了视频,我迫不及待地想去学古琴了!”外国网友GaiaMiranda这则英文留言,是中国文化对外吸引力的有力证明。

  “自得琴社的演奏视频之所以受到海内外观众欢迎,是因为他们把中国文化和美学视觉结合得很棒。中外观众不仅可以聆听民乐,还能欣赏中国服装和历史,这对中华文化的对外推广起到有益作用。”多年来致力于民乐“破圈”的唢呐演奏家胡晨韵表示,正是大家一起守正创新,中国民乐不断发展和与时俱进,“有更多人发自内心地喜欢上了中国民族乐器,也有越来越多的外国人愿意来学习演奏民乐”。

  最古老也最新潮的民乐正在走向世界

  如果说几年前的中国国乐,还是业内人士口中“小众艺术里的小众艺术”,那么近年来归功于国乐人的共同努力,国乐正在逐渐成为一种大众艺术,不仅获得了国内受众的追捧,也在海外产生了很大的影响力,向世界展示中国文化自信。

  以成员为Z世代居多的自得琴社为例,他们紧跟卡塔尔世界杯这一全球潮流热点,身着中国传统服饰,演奏1998年世界杯主题曲《生命之杯》。视频中既有笛子、唢呐等中国传统乐器,也有非洲鼓、箱鼓等外国乐器,中西乐器交流碰撞出热烈的音符,与世界足球盛会的氛围相契合,中国人的热情好客迎面而来。在国内视频号和海外视频平台YouTube,来自世界多地的网友们,用不同的语言表达了对中国文化的喜爱。海外网友Waterlow56说:“绝对的天才创意!如此有趣,我看了觉得很快乐。”

  “自得琴社的这支音乐视频风格生动活泼,成员们用了一些比较夸张的动作、俏皮的表情,可以拉近和世界观众的距离;1998年世界杯主题曲《生命之杯》的旋律,也为全球观众所熟悉,用音乐艺术的方式进行传播,突破了语言的限制,让包括民乐在内的中国古老的传统文化,以最潮的方式走向了世界。”上海外国语大学新闻传播学院教授蔡盈洲在接受记者采访时说。

  在海外视频平台YouTube上,自得琴社发布的视频累计观看量接近9000万次。2019年改编自国漫《秦时明月》的《空山鸟语》,是自得琴社第一支搭配装束复原的视频,此后自得琴社一直延续“古装配古琴”的模式,改编着他们喜欢的传统名曲和现代音乐。最近几年,从《长安十二时辰幻想曲》、巴赫《G弦上的咏叹调》,到《哈利·波特》主题曲、《愤怒的小鸟》,再到最近的《生命之杯》,自得琴社的视频持续“破圈”,不断引起海内外网友的关注和讨论。

  “根据不同的音乐背景,演员们的每一套服饰几乎都有参考文献,一针一线都十分考究。而在音乐编配上,我们会基于自身乐队配置和民乐特点进行创意改编,没有太明确的条条框框和限制。”自得琴社社长朱里钺告诉记者,成员们平时自己也爱踢球,所以自然而然地想到了改编《生命之杯》这首歌曲。“传统文化的创新,离不开Z世代自发的兴趣和爱好,离不开对世界文化的博采众长,离不开对中国文化发自内心的自信与认同。”朱里钺说。

  在学者看来,中华优秀传统文化的传播要充分体现时代性,利用短视频等新媒体技术形式,通过对世界经典名曲的二次创作、中西合璧的民乐原创作品等方式,让底蕴深厚的传统文化以更新潮、更能引起全世界人民共情的方式走向全球;着重发掘和培养更多像自得琴社一样,能够发挥明星效应,对外推广我国传统文化、促进国际文化交流的艺人团体。

  破次元引领属于未来的审美潮流

  去年,唢呐演奏家胡晨韵举行了一场“吹破次元”的民乐音乐会。《青鸟》《灌篮高手》《好想大声说爱你》等动漫曲目,承载着不少80后90后的青春回忆,很多人带着娃前来听音乐会,大家挥舞着凯迪拉克·上海音乐厅贴心准备好的荧光棒,发出“爷青回”的呐喊。

  这场音乐会突出大众性和普及性,名为“吹破次元”,就是希望通过高质量的现场,把很多没有来过音乐厅、没有听过民族音乐会的人引入剧场。“不能光是我们几个演奏专家把民乐给提升上去,那样民乐的路反而会走得很窄。”在胡晨韵看来,不少“网红”国乐UP主也并非专业出身的国乐演奏者,“但年轻人喜欢这种潮的感觉,就是好事儿”。

  其实,国风音乐的风格和表演方式可以无拘无束。以这场“吹破次元”音乐会为例,上海音乐厅迎来了自1930年建厅92年以来,第一个登台的虚拟艺人——冷鸢yousa,她的歌声和胡晨韵的唢呐伴奏,交织成国风作品《大喜》的激烈火花。音乐会上还有跨国合作,胡晨韵连线了《大鱼海棠》音乐制作人吉田潔,他在当地录制了钢琴,而胡晨韵用电吹管吹出了尺八的音色。更不必说国漫音乐中,中西乐器的对话与对撞,比如《暗影刺客》(《刺客伍六七》主题曲),琵琶大段SOLO和摇滚乐队相结合;《心猿归正》(《一人之下》第三季片尾曲),中国戏曲和流行FUNK节奏相结合,请了乐团的琵琶演奏家玩儿放克。

  “以前是外国人穿着晚礼服去听交响乐,现在有越来越多的中国年轻人,心怀对传统文化的热爱,穿着中国传统服饰来看我们的音乐会,这就是文化自信的具象体现。”就像朱里钺所说,越来越时髦的中国民乐,吸引了越来越多的年轻受众,能够引领属于未来的审美潮流。(姜方)

中国网客户端

国家重点新闻网站,9语种权威发布

彩票驿站地图