Deploy常见问题

在配置文件fe.conf中priority_networks参数如何绑定固定IP

问题描述：

比如客户放有2个ip,比如ip为：192.168.108.23，192.168.108.43，如果写192.168.108.23/24会自动识别到43，如果写192.168.108.23/32会出错，启动后会识别到127.0.0.1。

解决方案:

32就不用写了，直接写ip就行；或者再写长一点28这种。

注:（如果写 32 出错，是当前版本比较低，新版本已经修复了这个问题。）

be http_service启动失败

问题描述：

be安装过程中启动报错 Doris Be http service did not start correctly,exiting

解决方案：

该问题是be webservice端口被占用，可以尝试修改be.conf中的相关端口并重启。如果多次修改没有被占用的端口也重复报错，检查是否装有yarn等程序，确认监听端口选择修改监听规则，或者be的端口选取范围绕过即可。

SUSE 12SPS的 OS 是否支持

可以支持，经过测试是没有问题的

ERROR 1064 (HY000): Could not initialize class org.apache.doris.rpc.BackendServiceProxy

检查是否使用的是jre,如果使用的jre换成jdk即可，推荐使用oraclejdk版本1.8+。

【企业版部署】安装部署过程当中，在配置节点时报错：Failed to Distribute files to node

目前安装报错的信息是因为setuptools的版本不对，需要到每台机器上执行下以下命令，因为需要root权限

yum remove python-setuptools

rm /usr/lib/python2.7/site-packages/setuptool* -rf

wget https://bootstrap.pypa.io/ez_setup.py -O - | python

StarRocks能否临时修改FE、BE的配置让其不重启就能生效，生产环境不能随便重启服务

FE配置临时修改：

SQL方式：

ADMIN SET FRONTEND CONFIG ("key" = "value");

--示例：
ADMIN SET FRONTEND CONFIG ("enable_statistic_collect" = "false");

命令方式：

curl --location-trusted -u username:password http://ip:fe_http_port/api/_set_config?key=value

示例：

curl --location-trusted -u root:root  http://192.168.110.101:8030/api/_set_config?enable_statistic_collect=true

BE配置临时修改：

命令方式：

curl -XPOST -u username:password http://ip:be_http_port/api/update_config?key=value

是该用户没有远程登录的权限:

CREATE USER 'test'@'%' IDENTIFIED BY '123456';
GRANT SELECT_PRIV ON . TO 'test'@'%';

创建用户test并赋权，重新登录即可。

[磁盘扩容问题] BE磁盘空间不足，加盘后数据存储不能负载均衡且报错：Failed to get scan range, no queryable replica found in tablet: 11903

问题描述：

Flink导入报错，定位原为磁盘不足，扩容磁盘后，不能对数据存储进行负载均衡，而是随机的。

解决方案:

目前正在修复当中，解决方法测试客户如果数据不重要推荐直接删除掉磁盘，线上客户或者重要数据推荐手工操作

不是重要数据直接删除掉磁盘的话可能会面临一个问题就是：切换完磁盘目录后，会报错：

Failed to get scan range, no queryable replica found in tablet: 11903，

解决方法是把这张表11903 在truncate 一下之后即可。

集群重启时，fe启动失败报错：Fe type:unknown ,is ready :false

确认master是否已启动，或者尝试逐台重启。

安装集群报错：failed to get service info err

检查机器是否开启了sshd。/etc/init.d/sshd status查看sshd状态。

BE启动失败，日志报错：Fail to get master client from cache. host= port=0 code=THRIFT_RPC_ERROR

检查be.conf中的端口是否占用，netstat -anp |grep port查看是否占用，更换其他空闲端口后重启。

企业版升级Manager时，提示：Failed to transport upgrade files to agent host. src:…

检查对应的磁盘，看是否空间不足。因为在集群升级时，Manager会将新版本的二进制文件分发至各个节点，若部署目录的磁盘空间不足，就无法完成文件分发，出现上述报错。

新扩容节点的FE状态正常，但是Manager"诊断"页面下该FE节点日志展示报错："Failed to search log."

Manager默认30秒内去获取新部署FE的路径配置，如果FE启动较慢或由于其他原因导致30s内未响应就会出现上述问题。检查Manager Web日志，日志目录例如：/starrocks-manager-xxx/center/log/webcenter/log/web/drms.INFO，搜索日志是否有：Failed to update fe configurations，若有，重启对应的FE服务。重启会重新获取路径配置。

fe启动失败报错：exceeds max permissable delta:5000ms

服务器时差超过5s，需要校准服务器时间

be节点如果有多块盘做存储，storage_root_path这个参数该怎么设置？

be.conf里配置storage_root_path参数，用;隔开

添加fe，一直显示集群id不一样，这个怎么办：invalid cluster id: 209721925

这种问题是因为元数据不一致了，常见于第一次安装时没有加--helper参数，此场景需要将meta目录清空，然后通过--helper的方式重新加入集群

fe显示已经启动，有transfer：follower，但是show frontends;显示状态false

jvm过小，内存始终超过一半了，没有做checkpoint。重启很慢，正常情况积累了5w个log就会做checkpoint，建议业务低峰期，修改各fe jvm参数并重启fe

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Deploy_faq.md

Deploy_faq.md

Deploy常见问题

在配置文件fe.conf中priority_networks参数如何绑定固定IP

be http_service启动失败

SUSE 12SPS的 OS 是否支持

ERROR 1064 (HY000): Could not initialize class org.apache.doris.rpc.BackendServiceProxy

【企业版部署】安装部署过程当中，在配置节点时报错：Failed to Distribute files to node

StarRocks能否临时修改FE、BE的配置让其不重启就能生效，生产环境不能随便重启服务

[磁盘扩容问题] BE磁盘空间不足，加盘后数据存储不能负载均衡且报错：Failed to get scan range, no queryable replica found in tablet: 11903

集群重启时，fe启动失败报错：Fe type:unknown ,is ready :false

安装集群报错：failed to get service info err

BE启动失败，日志报错：Fail to get master client from cache. host= port=0 code=THRIFT_RPC_ERROR

企业版升级Manager时，提示：Failed to transport upgrade files to agent host. src:…

新扩容节点的FE状态正常，但是Manager"诊断"页面下该FE节点日志展示报错："Failed to search log."

fe启动失败报错：exceeds max permissable delta:5000ms

be节点如果有多块盘做存储，storage_root_path这个参数该怎么设置？

添加fe，一直显示集群id不一样，这个怎么办：invalid cluster id: 209721925

fe显示已经启动，有transfer：follower，但是show frontends;显示状态false

Files

Deploy_faq.md

Latest commit

History

Deploy_faq.md

File metadata and controls

Deploy常见问题

在配置文件fe.conf中priority_networks参数如何绑定固定IP

be http_service启动失败

SUSE 12SPS的 OS 是否支持

ERROR 1064 (HY000): Could not initialize class org.apache.doris.rpc.BackendServiceProxy

【企业版部署】安装部署过程当中，在配置节点时报错：Failed to Distribute files to node

StarRocks能否临时修改FE、BE的配置让其不重启就能生效，生产环境不能随便重启服务

[磁盘扩容问题] BE磁盘空间不足，加盘后数据存储不能负载均衡且报错：Failed to get scan range, no queryable replica found in tablet: 11903

集群重启时，fe启动失败报错：Fe type:unknown ,is ready :false

安装集群报错：failed to get service info err

BE启动失败，日志报错：Fail to get master client from cache. host= port=0 code=THRIFT_RPC_ERROR

企业版升级Manager时，提示：Failed to transport upgrade files to agent host. src:…

新扩容节点的FE状态正常，但是Manager"诊断"页面下该FE节点日志展示报错："Failed to search log."

fe启动失败报错：exceeds max permissable delta:5000ms

be节点如果有多块盘做存储，storage_root_path这个参数该怎么设置？

添加fe，一直显示集群id不一样，这个怎么办：invalid cluster id: 209721925

fe显示已经启动，有transfer：follower，但是show frontends;显示状态false