当前在线人数13586
首页 - 分类讨论区 - 电脑网络 - 葵花宝典版 - 同主题阅读文章

此篇文章共收到打赏
0

  • 10
  • 20
  • 50
  • 100
您目前伪币余额:0
未名交友
[更多]
[更多]
请教搞数据科学的专家,jupyter和zeppelin应用场景
[版面:葵花宝典][首篇作者:fangtuo2] , 2019年06月12日02:07:26 ,1113次阅读,18次回复
来APP回复,赚取更多伪币 关注本站公众号:
[分页:1 ]
fangtuo2
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: fangtuo2 (方鸵), 信区: Programming
标  题: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Wed Jun 12 02:07:26 2019, 美东)

请教搞数据科学的专家,jupyter和zeppelin应用场景有何不同。

我只是观察到个表面现象:
    - 好像用spark的人们都推崇zeppelin;
    - 其他大部分人都推崇jupyter。

另外,是不是zeppelin的可视化功能要比jupyter强大很多?


还有什么本质区别吗?


--
※ 修改:·fangtuo2 於 Jun 12 02:16:06 2019 修改本文·[FROM: 2601:641:8000:74]
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2601:641:8000:7]

 
magliner
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: magliner (magliner), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Wed Jun 12 08:50:53 2019, 美东)

从我一个实验员的角度看, 朱皮特可以学, 为什么? 不为什么, 因为是时尚。
zeppelin, 不要学, 功能有限, 就是个玩具。 小孩子玩玩具, 你长大了还玩么 ?
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 205.]

 
wdong
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 3 ]

发信人: wdong (万事休), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Wed Jun 12 09:20:25 2019, 美东)

jupyter还是有点用的. zeppelin不知道;spark好久没用了. 没那么大的数据.

【 在 fangtuo2 (方鸵) 的大作中提到: 】
: 请教搞数据科学的专家,jupyter和zeppelin应用场景有何不同。
: 我只是观察到个表面现象:
:     - 好像用spark的人们都推崇zeppelin;
:     - 其他大部分人都推崇jupyter。
: 另外,是不是zeppelin的可视化功能要比jupyter强大很多?
: 还有什么本质区别吗?



--

※ 来源:·BBS 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 99.]

 
hefande88
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 4 ]

发信人: hefande88 (盒饭口活的88), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Wed Jun 12 10:15:28 2019, 美东)

小万 你终于回来了
没有你的自宫版 质量下降百分之69%
【 在 wdong (万事休) 的大作中提到: 】
: jupyter还是有点用的. zeppelin不知道;spark好久没用了. 没那么大的数据.



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 64.]

 
Marcus2010
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 5 ]

发信人: Marcus2010 (马库斯), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Wed Jun 12 14:04:30 2019, 美东)

Zeppelin - apache生态only
Jupyter - anything else

--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 4.]

 
fangtuo2
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 6 ]

发信人: fangtuo2 (方鸵), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场
发信站: BBS 未名空间站 (Wed Jun 12 16:56:49 2019, 美东)

Jupyter 玩spark不行?


【 在 Marcus2010(马库斯) 的大作中提到: 】
<br>: Zeppelin - apache生态only
<br>: Jupyter - anything else
<br>
--
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2600:1010:b00c:]

 
HappyE
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 7 ]

发信人: HappyE (HappyE), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场�
发信站: BBS 未名空间站 (Wed Jun 12 19:40:32 2019, 美东)


【 在 fangtuo2 (方鸵) 的大作中提到: 】
: Jupyter 玩spark不行?
: <br>: Zeppelin - apache生态only
: <br>: Jupyter - anything else
: <br>

很可以啊!

--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 66.]

 
hulk
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 8 ]

发信人: hulk (巨人), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Wed Jun 12 21:50:54 2019, 美东)


刚看见个文章、说到点子上了


大部分的big data problem都可以用data warehouse解决。这些Hadoop 公司要跟着
Cloudera 倒一批。 剩下的需求基本上都在cloud managed services上解决了。Hadoop
系统问题就是太复杂、几十个tool
--
※ 来源:·iOS 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 148.]

 
fangtuo2
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 9 ]

发信人: fangtuo2 (方鸵), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场
发信站: BBS 未名空间站 (Wed Jun 12 22:44:00 2019, 美东)

大部分数据问题恰恰不是data warehouse的问题啊。

大数据这一波概念是过去了,我建议赶时髦当数据科学家的要提前做好下一轮概念的到
来。举个例子,databrick这个spark公司上一轮融资用的概念是AI






【 在 hulk(巨人) 的大作中提到: 】
<br>: 刚看见个文章、说到点子上了
<br>: 大部分的big data problem都可以用data warehouse解决。这些Hadoop 公司要
跟着
<br>: Cloudera 倒一批。 剩下的需求基本上都在cloud managed services上解决了。
Hadoop
<br>:  系统问题就是太复杂、几十个tool
<br>
--
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2600:1010:b00c:]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 10 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: 璇锋暀鎼炴暟鎹瀛︾殑涓撳锛宩upyter鍜寊ep
发信站: BBS 未名空间站 (Wed Jun 12 22:51:41 2019, 美东)

数据科学家和大数据不是一波的。


【 在 fangtuo2(方鸵) 的大作中提到: 】
<br>: 大部分数据问题恰恰不是data warehouse的问题啊。
<br>: 大数据这一波概念是过去了,我建议赶时髦当数据科学家的要提前做好下一轮概
念的到
<br>: 来。举个例子,databrick这个spark公司上一轮融资用的概念是AI
<br>: 跟着
<br>: Hadoop
<br>
--
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2607:fb90:1cd4:]

 
hulk
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 11 ]

发信人: hulk (巨人), 信区: Programming
标  题: Re: 璇锋暀鎼炴暟鎹瀛︾殑涓撳锛宩upyter鍜寊ep
发信站: BBS 未名空间站 (Wed Jun 12 22:59:38 2019, 美东)

数据科学这波会再拖几年,但没啥大产出的话很快也会冷下来的

好用的一些工具都被云给占了,云计算会再火5-10年


【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: 数据科学家和大数据不是一波的。
: <br>: 大部分数据问题恰恰不是data warehouse的问题啊。
: <br>: 大数据这一波概念是过去了,我建议赶时髦当数据科学家的要提前做好下一轮概
: 念的到
: <br>: 来。举个例子,databrick这个spark公司上一轮融资用的概念是AI
: <br>: 跟着
: <br>: Hadoop
: <br>



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 148.]

 
fangtuo2
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 12 ]

发信人: fangtuo2 (方鸵), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zep
发信站: BBS 未名空间站 (Wed Jun 12 23:06:51 2019, 美东)

数据科学家这个title好像是Cloudera联合创始人在Facebook的时候发明的


【 在 guvest(我爱你老婆Anna) 的大作中提到: 】
<br>: 数据科学家和大数据不是一波的。
<br>: 念的到
<br>
--
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2600:1010:b00c:]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 13 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zep
发信站: BBS 未名空间站 (Wed Jun 12 23:15:46 2019, 美东)

GooG的page rank本身就是ML算法。Netflix也早就用ML算法了。Siri 2011年就出了。
ML创造的价值一直都在涨。DL之前ML其实已经很热了。你可问问算法的提高让GooG,FB
广告收益涨了多少。当年国内今日头条的推荐算法帮助他家2个月就拿到1亿用户。认为
算法没有创造价值是不对的。

另外你们不更新看法是很不利的。我这边新招的硕士生上课都做过简单的推荐系统。老
师傅不更新知识更麻烦。

不管DS这个title 怎么样。ML engineer 必然是常做常有。数据这一端,如果不上5G,
全球能用手机的也就那么多人那么多时间,差不多饱和了。

数据不增长,就只有变花样玩数据。所以需要ML 算法。


【 在 hulk(巨人) 的大作中提到: 】
<br>: 数据科学这波会再拖几年,但没啥大产出的话很快也会冷下来的
<br>: 好用的一些工具都被云给占了,云计算会再火5-10年
<br>



--
※ 修改:·guvest 於 Jun 12 23:19:20 2019 修改本文·[FROM: 47.]
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2607:fb90:1cd4:]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 14 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Wed Jun 12 23:20:54 2019, 美东)

可以先读一下克努奇的一个文章,叫做literature programming。

--
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2607:fb90:1cd4:]

 
netghost
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 15 ]

发信人: netghost (Up to Isomorphism), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zep
发信站: BBS 未名空间站 (Wed Jun 12 23:31:51 2019, 美东)

很多人不知道google成功根本不是因為pagerank。
【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: GooG的page rank本身就是ML算法。Netflix也早就用ML算法了。Siri 2011年就出了。
: ML创造的价值一直都在涨。DL之前ML其实已经很热了。你可问问算法的提高让GooG,
FB
: 广告收益涨了多少。当年国内今日头条的推荐算法帮助他家2个月就拿到1亿用户。认为
: 算法没有创造价值是不对的。
: 另外你们不更新看法是很不利的。我这边新招的硕士生上课都做过简单的推荐系统。老
: 师傅不更新知识更麻烦。
: 不管DS这个title 怎么样。ML engineer 必然是常做常有。数据这一端,如果不上5G,
: 全球能用手机的也就那么多人那么多时间,差不多饱和了。
: 数据不增长,就只有变花样玩数据。所以需要ML 算法。
: <br>: 数据科学这波会再拖几年,但没啥大产出的话很快也会冷下来的
: ...................


--

※ 来源:·BBS 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 71.]

 
harvardbbs99
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 16 ]

发信人: harvardbbs99 (harvardbbs99), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Thu Jun 13 01:00:43 2019, 美东)

although these ides are good for many languages, they are best for their own
native languages. that is their forte.
rstudio-r
jupyter-python
zeppelin-java,scala,spark

--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 173.]

 
moonrain
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 17 ]

发信人: moonrain (Just One Night), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Thu Jun 13 08:20:49 2019, 美东)

大部分没能力发nips 又不会像码农做deployment 只会在jupyter上面用library写写几
行script的 所谓数据科学家 很快就会完蛋或者被打回原型成BA吧

--
☆ 发自 iPhone 买买提 1.24.10
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 107.]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 18 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zep
发信站: BBS 未名空间站 (Thu Jun 13 09:19:00 2019, 美东)

讲成功那就太遥远了。讲page ranking算法上线被几十亿人用了很多年,算法部分没有
大的问题应该是可以的。另外200X年有个綜述,講ML十大算法,都是實戰選出來的。


【 在 netghost(Up to Isomorphism) 的大作中提到: 】
<br>: 很多人不知道google成功根本不是因為pagerank。
<br>: FB
<br>
--
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 38.]

 
HappyE
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 19 ]

发信人: HappyE (HappyE), 信区: Programming
标  题: Re: 请教搞数据科学的专家,jupyter和zeppelin应用场景
发信站: BBS 未名空间站 (Thu Jun 13 12:45:00 2019, 美东)

同样的算法调一点就可以应用在很多不同的领域,以前是广告搜索,还有电商,供应链
,金融欺诈,网络安全,生物医药,交友配对。人工智能可以发展聊天机器人,图影相
识别,智能家电,智能车。现在请的人越来越多的原因是配合数据种类的增加,每个领
域的数据都需要配合niche的数据科学应用。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 66.]

[分页:1 ]
[快速返回] [ 进入葵花宝典讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996